Занятие №2
Занятие № 2
Методология поиска деструктивного контента
Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета.
Существуют три основных способа поиска информации в Интернете[1]:
1. Указание адреса страницы.
2. Передвижение по гиперссылкам.
3. Обращение к поисковой системе (поисковому серверу).
Способ 1: Указание адреса страницы - это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.
Не стоит забывать возможность поиска по открытой в окне браузера web-странице (Правка-Найти на этой странице…).
Способ 2: Передвижение по гиперссылкам - это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.
Способ 3: Обращение к поисковой системе. Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.
На помощь приходят специальные поисковые системы (их еще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернет популярны следующие поисковые серверы: Яндекс (yandex.ru), Google (google.ru) и Rambler (rambler.ru).
Существуют определенные операции, позволяющие осуществить более продуктивный поиск, например, «Google»[2], дает следующие советы по сбору информации (актуальные и для других «поисковиков»):
1. Чтобы найти точную фразу или слово для точного поиска – необходимо заключить его в кавычки.
2. Чтобы найти точную цитату – необходимо взять всю цитату в кавычки, в случае, если Вы забыли одно из слов в цитате - вместо пропущенного слова поставьте звёздочку – «*» – цитата найдётся вместе с забытым словом.
3. Чтобы исключить страницы с определёнными словами из результатов поиска – поставь перед ними знак минуса «-».
4. Чтобы найти любые из нескольких слов – перечислите все подходящие варианты через вертикальный слеш — «|» - Google будет искать документы с любым из этих слов.
5. Чтобы найти слова в пределах одного предложения необходимо соединить эти слова специальным символом амперсанда — «&» - Google будет искать документы, где эти слова стоят в одном предложении.
6. Для поиска информации на определенном сайте (и только на нем) введите в поле запроса его адрес, предварив словом «site» и двоеточием (например, site:http://www.3dnews.ru).
Также следует обратить внимание на альтернативные поисковики:
Nigma.ru – фильтрует результаты других поисковых систем среди всех поисковых систем, которые можно встретить в интернете, существует особая группа поисковиков. Она отличается от всех остальных тем, что в них реализована функция мультипоиска, то есть одновременного поиска по нескольким поисковым системам. Одной из таких мультипоисковых систем является российский сервис Nigma.ru[3].
Nigma содержит собственную базу ресурсов, но помимо этого позволяет выполнять поиск сразу по всем наиболее популярным поисковым системам, в числе которых – Google, MSN, Yandex, Rambler, AltaVista, Yahoo и Aport. Механизм отбора результатов в этой поисковой машине отличается от большинства принятых методов обнаружения сайтов. Дело в том, что движок этого сервиса использует кластеризацию результатов. Что это означает? Представьте себе, что вы решили для себя выяснить, что такое «рендеринг». Сопоставив результаты в разных поисковых системах, движок Nigma.ru отобрал наиболее вероятные результаты и при этом в левой части окна, рядом со списком результатов поиска, отобразил так называемые кластеры – «визуализация», «создание», «система», «rendering», «процесс», «studio max», «компьютерной графики» и другие слова и словосочетания. Эти кластеры представляют собой тематическую группу найденных документов. Таким образом, можно быстро сузить круг поиска или конкретизировать поисковый запрос. В Nigma.ru можно также использовать рубрики, чтобы ограничить область, из которой будут выбираться результаты - например, выполнять поиск только с учетом музыкальных ресурсов или вывести результаты только для изображений. Еще одна возможность этого сервиса может быть интересна школьникам и студентам. Nigma.ru предлагает сервисы Nigma-математика и Nigma-химия. Первый предназначен для быстрого решения простых уравнений и различных арифметических операций, второй позволяет работать с формулами химических реакций. Поисковый сервис распознает более тысячи физических, математических констант и единиц измерения, позволяя быстро выполнять преобразование из одной размерности в другую.
Searchme.com – поисковик с предпросмотром. Всем известно, что для того чтобы найти конкретную информацию в сети, необходимо потратить немало времени. Просматривая результаты поиска, пользователь, в основном, открывает ресурсы наугад, не зная наверняка, найдет ли он на новой странице то, что его интересует, или это будет пустой тратой времени. Создатели поискового сервиса searchme.com задумались над этой проблемой и придумали ее оригинальное решение. Суть этого решения состояла в том, чтобы создать такую поисковую систему, в которой пользователь мог бы посмотреть на приблизительный эскиз страницы еще до ее загрузки. Это позволило бы составить дополнительное мнение о серьезности ресурса и о его содержании.
Следует отдельно рассмотреть методологию поиска информации через социальные сети, где основной поиск осуществляется через использование заданных алгоритмов поиска – вербальным маркерам, хештегам.
Кроме того, эффективным методом поиска информации в социальной сети является метод снежного кома – переход от одного информационного актора (аккаунт, сообщество, встреча и т.п.) к другому (аккаунт, сообщества, встреча т.п.) через обнаружение признаков деструктивного контента. Так обнаружив сообщество, пропагандирующее идеи национализма, мы можем от него перейти к выявлению аккаунтов отдельных пользователей приверженцев националистической идеологии и далее к другим сообщества по данной тематики, в которых состоят выявленные пользователи.
Для поиска в социальных сетях могут быть использованы специальные программные средства:
1. Поиск по комментариям и постам, например – borstch.com/other/vk-post-scane.
2. Поиск по фотографии, например – http://findface.ru/ -– посредством загрузки образца картинки поисковые системы могут найти ресурсы, на которых размещено данное изображение, а также показать изображения схожие с загруженным.
3. Сравнение двух групп с целью выявления пересечений – https://vk.com/app3771868.
Список рекомендуемой литературы
- Cмuрнoв, Ю£. Научный ноиск в Интернете // Культура: теория и практика. 2016. № 3 (12). С. 13
- Кальченко Д. Интеллектуальные агенты семантического Web // КомпьютерПресс. 2004. № 10. С. 26—32.
- Конотопов, П. Ю. Аналитика. Методология, технологические и организационные аспекты информационно-аналитической работы / П. Ю. Конотопов, Ю. В. Курносов. - М., 2004. - 520 с.
Пuменoв, E.H., Ильин, A.H. Информационные поиски в Интернете: проведение тематических поисков // Научно-техническая информация. Серия 2: Информационные процессы и системы. 2010. № 10. С. 7-12.
[1] Подробнее об этих способах можно почитать - http://chaltlib.ru/articles/Library/spetsialistu/ucheba/osvoenie_tekhnologijj_obuchajushhijj_kurs/poisk_informatsii_v_internete/.
[2] Все формулы поиска Google http://www.google.com/insidesearch/