Поиск информации в Интернете. Шпионские штучки

Кто владеет информацией, тот владеет миром. Для помощника руководителя желание обладать определенными знаниями продиктовано вовсе не тщеславием или идеями завоевать мир, а чаще всего профессиональной необходимостью. Умение добыть полезные данные является, бесспорно, одним из ключевых в работе персонального ассистента, поскольку далеко не всегда истинная или нужная информация лежит на поверхности.

Что такое конфиденциальность информации?

Согласно п. 7 ст. 2 Федерального закона от 27.07.2006 № 149-ФЗ «Об информации, информационных технологиях и о защите информации» (в ред. от 24.11.2014) конфиденциальность информации - обязательное для выполнения лицом, получившим доступ к определенной информации, требование не передавать такую информацию третьим лицам без согласия ее обладателя . Другое понятие конфиденциальности - это недоступность для определенного круга пользователей информации. Так или иначе, это информация, которая передается только по определенным правилам, установленным ее правообладателем, будь то юридическое лицо (организация) или физическое лицо (обычный гражданин, ставший нам по каким-то причинам интересным). Так, с одной стороны, конфиденциальность обеспечивает защиту правообладателю информации, а с другой - создает препятствия для того, кого интересует доступ к ней.

Информационный puzzle

Одним из особых свойств информации является то, что она «живет», т.е. передается тем или иным способом, с использованием различных методов и инструментов. По этой причине даже конфиденциальная информация, заполучить которую путем подачи официального запроса оказывается зачастую невозможным, появляется в общем доступе из-за невнимательности ее правообладателя или беспечного отношения к своим данным. Сегодня, ввиду активного использования современных технических устройств, а также сети Интернет чаще всего кусочки мозаики от общего информационного образа ее правообладателя хаотично разбросаны в интернет-пространстве. Для того чтобы скрыть данные, необходимо делать это целенаправленно, кроме того, нужно обладать определенными умениями и навыками. Да и потом, разве кому-то придет в голову, что по поводу его персоны или организации кто-то задумает провести информационное расследование?

Словом, для того чтобы добыть необходимые сведения, ассистенту руководителя достаточно иметь доступ в Интернет, сделать необходимые запросы, собрать данные и в полной мере использовать свои аналитические способности.

Шпионские мотивы

Недостаток информации - основной мотив для пополнения информационного запаса. Известно, что действия, предпринятые в условиях дефицита информации, могут привести к неприятным последствиям. Целеполагание в «информационном расследовании» играет большую роль, с одной стороны, в определении ожидаемого результата, с другой - в выборе источников для поиска нужных данных. В профессиональной деятельности помощник руководителя может получать различные поручения от своего начальства, касающиеся поиска какого-либо рода сведений. Их перечень индивидуален, и, вероятно, его границы необозримы. Однако можно выделить основные ситуации, для разрешения которых ассистенту руководителя будет полезно прибегнуть к сбору дополнительной информации.

  • Собеседование. Смена места работы и поиск нового требуют ответственности и тщательного анализа полученных о работодателе данных. Бывает, что по итогам одного или нескольких этапов собеседования, недостаточно данных для принятия взвешенного решения «за» или «против». Или по причине того, что работодатель не предоставил необходимые материалы из-за отсутствия времени или просто не придав им значения, или из-за желания намеренно их скрыть. В любом случае, представители компании вряд ли готовы на собеседовании отвечать на «тонкие» частные вопросы честно, например, на вопросы о задержке заработной платы, текучке кадров или связанные с общими проблемами в организации.

При наличии исходных данных ассистенту руководителя рекомендуется до прохождения собеседования найти максимум полезной информации о компании: с одной стороны, чтобы подстраховаться и задать необходимые вопросы, с другой - чтобы иметь возможность проявить профессионализм и блеснуть осведомленностью и подготовленностью к встрече.

  • Профессиональные задачи. Деятельность современных организаций неизбежно связана с сотрудничеством между друг другом. Каждая фирма имеет партнеров, заказчиков, исполнителей-контрагентов и т.д. Так, например, до заключения договора с определенной компанией на поставку продукции или оказание услуг, юрист запрашивает для проверки необходимый пакет документов, содержащий минимальный или максимально полный перечень - в зависимости от требований вашей организации к контрагентам. Не всегда проверкой компаний занимается юрист, в некоторых случаях это делает ассистент руководителя по поручению своего начальства. Поэтому поиск информации о новой компании или его руководстве может входить в обязанности персонального помощника.
  • Личные и профессиональные контакты. Помощник руководителя ежедневно общается с большим количеством людей (коллегами, подрядчиками, новыми знакомыми по работе или в частной жизни). Бывают случаи, когда по каким-то причинам необходимо собрать дополнительную информацию о человеке, например, при приеме на работу нового сотрудника: кем он работал ранее, чем увлекается, есть ли какие-то недочеты в профессиональной биографии и т.д. Относительно личных контактов дополнительные знания тоже лишними не будут, поскольку в большинстве случаев людям свойственно скрывать о себе личные сведения (в лучшем случае - ввиду простой человеческой подозрительности, в худшем - когда действительно есть что скрывать).

В крупных организациях часто создается т.н. служба безопасности. Она занимается профессиональным поиском всей информации о частных лицах или организациях, если того требует обеспечение деловой, экономической, промышленной безопасности компании. Как правило, у специалистов этой службы имеются в распоряжении свои ресурсы для наведения справок и сбора данных. Если в вашей организации существует служба безопасности, то рекомендуется обратиться к ее специалистам для получения нужной информации из надежных источников.

Исходные данные

При проведении «информационного расследования» никакие детали «мелкими» или лишними не бывают. Кроме того, в условиях недостатка сведений любой информационный «крючок» является необходимой зацепкой для нахождения полезных данных шаг за шагом. «Крючками» для поиска нужных материалов в интернет-пространстве являются верно сформулированные запросы, как и любые исходные данные, которыми ассистент руководителя в настоящий момент обладает. Достаточно будет самых «скромных», на первый взгляд, новостей, чтобы начать поиск.

Запрос по наименованию организации:

  • даст информацию о наименовании сайта компании;
  • позволит получить контактную информацию;
  • предоставит результаты поиска по данным новостных и рекламных ресурсов;
  • даст информацию о сфере деятельности, регистрационных данных, местонахождении и т.д.

Запрос по Ф.И.О. руководителя организации или частного лица:

  • поможет получить информацию о наименовании компании и сфере деятельности;
  • позволит ознакомиться с информацией рекламных, деловых, новостных ресурсов;
  • предоставит результаты поиска по резюме, биографиям, справочным материалам;
  • даст информацию о «присутствии» в деловых и развлекательных социальных сетях и т.д.

Запрос по номеру телефона компании или номеру мобильного телефона:

  • позволит получить информацию о компании в случае, если это офисный номер телефона;
  • даст информацию о принадлежности номера мобильного телефона к определенному региону России;
  • предоставит данные поиска по рекламным сайтам, объявлениям, размещенным вакансиям и предложениям организации или частного лица и т.д.

На заметку. Указанные исходные данные можно считать базовыми для дальнейшего сбора информации. Результаты поиска по указанным запросам необходимо использовать как данные для последующих запросов. Например, если изначально был известен только номер телефона организации, то по результатам такого запроса можно получить данные о наименовании организации, а следом и информацию с данными руководителей и учредителей.

Рассмотрим пример поиска информации и ее использования.

В поисковой системе вводим изначально известный номер телефона. Получаем следующий результат (рис. 1):

Далее по наименованию организации набираем следующий запрос и получаем несколько сайтов со справочной информацией об организациях. В данном случае знакомимся с результатами на сайте rusprofile . ru (рис. 2).

В каких случаях эта информация может быть полезна?

  • Ассистент руководителя получил задание связаться с редакцией журнала для размещения рекламы;
  • помощнику руководителя поручено подготовить официальное письмо на имя генерального директора, однако имя генерального директора изначально не было известно;
  • руководителю поступил звонок с определением номера телефона и имени контактного лица и помощника попросили уточнить, из какой компании звонили.

По запросам по Ф.И.О., номеру телефона и наименованию компании поисковые системы, как правило, предоставляют множество результатов со ссылками на различные ресурсы и сайты. Ассистенту руководителя рекомендуется внимательно ознакомиться со справочными материалами и тщательно отфильтровать полезные данные от «спама», уделяя также особое внимание источнику информации: официальный сайт организации в этом случае окажется более надежным, чем, например, рекламно-справочный веб-ресурс.

Таким образом, имея минимум исходных данных и навыки работы с поисковыми системами сети Интернет, помощник руководителя может найти необходимую в настоящее время информацию или получить дополнительные данные для дальнейших запросов и продолжения «информационного расследования».

«Элементарно, Ватсон!»

В интернет-пространстве каждый из пользователей так или иначе оставляет свои «следы», а сведения, когда-либо размещенные им, имеют «хвосты». Так, при использовании запросов в строке поиска Google, Yandex или других поисковых систем ассистент может ознакомиться с информацией:

  • о размещенных пользователем объявлениях на сайтах поиска работы или сотрудников, частных объявлениях о продаже или покупке, об оказываемых или требующихся услугах;
  • об опубликованных новостях организации или о должностных лицах, об участии в каких-либо деловых мероприятиях, выставках, прочей деятельности компании;
  • о созданных резюме и биографиях, если речь идет о частном лице;
  • о присутствии в социальных сетях и группах;
  • об отзывах о продукции компании или отзывах о компании как работодателе и мн. др.

Даже в случае, если информация о поиске работы или сотрудников, размещенные объявления и новости не являются актуальными, они не всегда удаляются правообладателями - по забывчивости или при отсутствии необходимости.

Что и где ищем? Как используем?

В зависимости от того, какую информационную задачу предстоит решить персональному ассистенту (будь то сбор максимально полной информации или только проверка определенных данных об организации или частном лице), могут быть выбраны и другие эффективные методы поиска в Интернете. Для их использования необходимы также исходные данные (достаточно будет информации о наименовании компании, или контактных данных, или Ф.И.О. руководителя или частного лица) (см. таблицу).

Вид информации и примеры ее использования

Вид информации

Примеры использования

Полное наименование компании и ее виды деятельности

Полное название, организационно-правовая форма и официально зарегистрированные виды осуществляемой деятельности - основная информация о компании. Она будет полезна как при поиске нового места работы для сбора данных о работодателе, так и в работе персонального ассистента для проверки деятельности партнера или контрагента.

Часто недобросовестные сотрудники организаций представляют свои компании как «крупные» или даже «международные», а на деле оказывается, что это обычные ИП, в перечень видов деятельности которых не входят те работы, для которых ваша компания планировала их привлечь

Дата регистрации в государственных органах

Дата регистрации предприятия в государственных органах имеет значение в том случае, если для вашей организации важен многолетний опыт работы контрагента или партнера в определенной области.

Например, если компания сообщила вам, что присутствует на рынке более 10 лет, а на самом деле зарегистрирована несколько месяцев назад, это может вызвать сомнения относительно солидности и надежности фирмы.

Информация о длительности функционирования предприятия будет полезна как в профессиональной работе помощника руководителя, так и в случае, если необходимо собрать наиболее полные данные о новом работодателе

Данные об учредителях и руководителях организации

Информация о руководстве и учредителях компании может включать сведения о количестве учредителей, их Ф.И.О., долях участия, количестве руководителей и их Ф.И.О. Польза этих данных состоит в том, что они могут послужить основой для последующего поиска информации. Так, например, зная учредителей и руководителей компании, необходимо сделать дальнейший запрос по Ф.И.О. и участию этих лиц в деятельности других организаций. Таким образом можно понять, насколько «крупными» являются учредители, и если их доли участия велики, возможно, они являются и инвесторами нескольких компаний. По результатам поиска можно пойти дальше и ознакомиться с деятельностью новых найденных компаний - для создания наиболее ясной картины деловой активности ее участников.

Кроме того, дополнительно полученные данные об учредителях и директорах можно проанализировать с разных точек зрения. Например, если в списке лиц одинаковые фамилии, вероятно, компания является семейной. Если встречаются фамилии иностранных лиц, возможно, предприятие имеет связи с зарубежными партнерами или головными организациями

Адреса и телефоны компании

Необходимость контактных данных переоценить сложно. Они исполняют свою основную роль: дают возможность связаться с организацией или отдельными ее сотрудниками. Однако порой имеет смысл сделать дополнительные запросы по адресу организации и по ее телефонам.

Случается, что по одному и тому же адресу компании могут находиться несколько юридических лиц. Таковыми зачастую являются как дочерние предприятия, так и сторонние организации. Кроме того, к регистрации по одному и тому же адресу часто прибегают недобросовестные организации, не имеющие средств для аренды полноценного офиса. Тогда на определенных условиях покупается юридический адрес, а фактически компания по указанному адресу не располагается.

По запросу помощника руководителя телефон компании может появиться в различных «ответах» поисковой системы. Необходимо тщательно ознакомиться с результатами, чтобы понять, нет ли в них информации, например, о занесении телефонного номера в черные списки работодателей и т.п.

Адрес официального сайта предприятия

Адрес официального сайта компании является очень информативным ресурсом:

  • если у организации нет сайта, то вероятно, у компании нет средств на его создание или она была создана относительно недавно;
  • имеет значение объем предоставленной компанией информации: наличие или отсутствие данных о руководителях, сотрудниках, новости, информация о партнерах или заказчиках и т.д.;
  • дата создания сайта и его интерфейс говорят о том, когда сайт был создан и насколько профессионально выполнен технически и с точки зрения дизайна;
  • наличие или отсутствие контактных данных (см. выше);
  • адрес домена сайта содержит дополнительную информацию, при помощи которой существует возможность дополнительной проверки

Размер уставного капитала компании

Большое значение имеет размер уставного капатала организации. Существует минимальный размер уставного капитала, и многие компании при регистрации им ограничиваются. Однако если компания поставляет вашему предприятию продукцию или оказывает услуги на сумму, в десятки или сотни раз превышающую ее уставный капитал, стоит помнить о том, что в случае недобросовестной работы или поставки ваша организация получит только то, что имеется в фонде компании

Наличие задолженностей перед налоговыми органами

Данные об отсутствии долгов являются только плюсом и говорят о компании как о добросовестном налогоплательщике. Однако наличие задолженностей перед налоговыми органами, как и размер этих задолженностей, необходимо обязательно учесть.

При трудоустройстве на работу будет полезно знать, нет ли у компании долгов перед Пенсионным фондом.

При сотрудничестве компании как с контрагентом или партнером задолженности могут стать показателем ее недобросовестного делового подхода или же убыточного положения

Участие в судебных разбирательствах

Информация об участии в судебных разбирательствах важна, однако при этом необходимо ознакомиться с их содержанием. Одно дело - неуплата штрафов за неправильную парковку служебного автомобиля, другое - трудовые споры или иные серьезные дела. Важно также учесть, выступала компания в роли истца или ответчика

Дисквалификация должностного лица

Случается, что должностные лица организаций, будь то руководители или иные должностные лица, дисквалифицируются в судебном порядке в соответствии с законодательством. Эта информация станет полезной для анализа новых компаний-партнеров или при трудоустройстве на работу. Особенно это важно для ассистента руководителя, работа которого напрямую связана с профессиональной деятельностью начальства

Адрес электронной почты контактного лица

По адресу электронной почты организации или ее сотрудника можно судить о ее «солидности». Как правило, в современных организациях принято пользоваться корпоративными электронными адресами, размещенными на своих доменах (доменный адрес после значка @), в целях информационной безопасности и показателя определенной корпоративной культуры. В случае, если адрес компании находится на общедоступном сервере, например mail.ru или yandex.ru, то имеет смысл дополнительно его проверить путем введения запроса по адресу в поисковой строке. По результатам поиска можно проанализировать, в каких статьях использовался адрес, в каких объявлениях был указан и не попал ли он в черные списки пользователей

Номер мобильного телефона

По номеру мобильного телефона можно узнать его принадлежность к определенной компании - фигурирует ли он по результатам поиска в объявлениях от имени юридического лица. Кроме того, он может быть зафиксирован и на сайтах частных объявлений - полезно будет ознакомиться с их содержанием. Необходимо обратить внимание, не занесен ли он в какие-либо черные списки пользователей и нет ли к нему комментариев.

Кроме того, по номеру мобильного телефона можно узнать его принадлежность к определенным телефонному оператору и региону

Личные данные

С целью характеристики личности будущего руководителя, новых коллег или же тех, с кем помощник руководителя пересекается на нынешнем месте работы, часто бывают полезными личные данные. Семейное положение, фотографии, увлечения, стиль общения, круг друзей, интересы - все это зачастую доступно в социальных сетях. Не рекомендуется тратить время на поиск подобной информации из праздного интереса, однако для дополнительной характеристики человека социальные сети могут предоставить персональному ассистенту различные данные: как положительно, так и отрицательно характеризующие личность

Отзывы работников, списки работодателей

Отзывы бывших сотрудников организаций, а также тех, кто участвовал в собеседованиях, проводимых организацией, имеют значение в том случае, если помощник руководителя планирует осуществлять в ней свою профессиональную деятельность. Стоить учесть, что всегда есть «обиженные» и «недовольные», не рекомендуется делать выводы исходя только из отзывов и комментариев частных лиц. Однако необходимо их учесть и сопоставить с другими данными о компании.

Кроме того, существуют официальные ресурсы, которые периодически публикуют списки как лучших, так и недобросовестных работодателей

В Интернете существует множество ресурсов, предлагающих предоставить пользователям информацию об организации. При этом есть те, на которых сведения представлены в свободном доступе, а также коммерческие сайты. Часто платные веб-страницы предлагают предоставить вам за деньги те данные, которые на другой странице вы найдете совершенно бесплатно. Не торопитесь оплачивать первую попавшуюся информацию, тщательно изучите имеющиеся ресурсы, в т.ч. надежные источники - официальные сайты различных служб, прежде чем прибегнуть к платному запросу.

Справочно. Как правило, данные по компаниям, опубликованные на справочных ресурсах, получены из открытых источников (ЕГРЮЛ и Росстат) и не подпадают под действие Федерального закона от 27.07.2006 № 152-ФЗ «О персональных данных» (в ред. от 21.07.2014) согласно ст. 6 Федерального закона от 08.08.2001 № 129-ФЗ «О государственной регистрации юридических лиц и индивидуальных предпринимателей» (в ред. от 30.03.2015; с изм. от 18.05.2015).

  • www .egrul .nalog .ru . Официальный сайт Федеральной налоговой службы предоставит ассистенту руководителя бесплатную информацию, опубликованную в соответствии с законодательством и не являющуюся конфиденциальной. Этот ресурс позволяет получить данные сразу по нескольким позициям, указанным в таблице.

Необходимые исходные данные для поиска: наименование юридического лица или ИП, ОГРН или ИНН (рис. 3).

В этом случае мы осуществляем поиск по наименованию юридического лица. Регион места нахождения вводить не обязательно, однако при наличии таких сведений их рекомендуется указать, чтобы получить наиболее полные результаты поиска. После введения данных нажимаем кнопку Найти и получаем результат (рис. 4).

При поиске на сайте Федеральной налоговой службы появляются результаты в формате pdf. Документы доступны для скачивания и содержат полную информацию о регистрации компании: данные об учредителях, руководителях, о дате регистрации, зарегистрированных видах деятельности, адресные данные и др. (рис. 5).

Ресурс налоговой службы удобен также тем, что предоставляет возможность поиска по другим базам данных, которым можно воспользоваться бесплатно, нажав на нужную ссылку и введя необходимые для запроса исходные данные. Ассистент руководителя легко найдет информацию о дисквалифицированных лицах, юридических лицах, которые имеют задолженность по уплате налогов, и другие полезные данные.

Стоит отметить, что для поиска может понадобиться дополнительная информация, например, для поиска по задолженностям - ИНН налогоплательщика (рис. 6). В случае если изначально ИНН известен не был, его можно посмотреть в сведениях о регистрации юридических лиц, полученных по результатам поиска по наименованию компании.

Признаки компаний-однодневок

Извлечение
из Общедоступных критериев самостоятельной оценки рисков для налогоплательщиков, используемые налоговыми органами в процессе отбора объектов для проведения выездных налоговых проверок,
утвержденных приказом ФНС России от 30.05.2007 № ММ-3-06/333@
«Об утверждении Концепции системы планирования выездных налоговых проверок»

(в ред. от 10.05.2012)

[…] При оценке налоговых рисков, которые могут быть связаны с характером взаимоотношений с некоторыми контрагентами, налогоплательщику рекомендуется исследовать следующие признаки:

Отсутствие личных контактов руководства (уполномоченных должностных лиц) компании-поставщика и руководства (уполномоченных должностных лиц) компании-покупателя при обсуждении условий поставок, а также при подписании договоров;

Отсутствие документального подтверждения полномочий руководителя компании-контрагента, копий документа, удостоверяющего его личность;

Отсутствие документального подтверждения полномочий представителя контрагента, копий документа, удостоверяющего его личность;

Отсутствие информации о фактическом местонахождении контрагента, а также о местонахождении складских и/или производственных и/или торговых площадей;

Отсутствие информации о способе получения сведений о контрагенте (нет рекламы в СМИ, нет рекомендаций партнеров или других лиц, нет сайта контрагента и т.п.). При этом негативность данного признака усугубляется наличием доступной информации (например, в СМИ, наружная реклама, Интернет-сайты и т.д.) о других участниках рынка (в том числе производителях) идентичных (аналогичных) товаров (работ, услуг), в том числе предлагающих свои товары (работы, услуги) по более низким ценам;

Отсутствие информации о государственной регистрации контрагента в ЕГРЮЛ (общий доступ, официальный сайт ФНС России www.nalog.ru).

Наличие подобных признаков свидетельствует о высокой степени риска квалификации подобного контрагента налоговыми органами как проблемного (или «однодневки»), а сделки, совершенные с таким контрагентом, сомнительными.

Дополнительно повышают такие риски одновременное присутствие следующих обстоятельств:

Контрагент, имеющий вышеуказанные признаки, выступает в роли посредника;

Наличие в договорах условий, отличающихся от существующих правил (обычаев) делового оборота (например, длительные отсрочки платежа, поставка крупных партий товаров без предоплаты или гарантии оплаты, несопоставимые с последствиями нарушения сторонами договоров штрафными санкциями, расчеты через третьих лиц, расчеты векселями и т.п.);

Отсутствие очевидных свидетельств (например, копий документов, подтверждающих наличие у контрагента производственных мощностей, необходимых лицензий, квалифицированных кадров, имущества и т.п.) возможности реального выполнения контрагентом условий договора, а также наличие обоснованных сомнений в возможности реального выполнения контрагентом условий договора с учетом времени, необходимого на доставку или производство товара, выполнение работ или оказание услуг;

Приобретение через посредников товаров, производство и заготовление которых традиционно производится физическими лицами, не являющимися предпринимателями (сельхозпродукция, вторичное сырье (включая металлолом), продукция промысла и т.п.);

Отсутствие реальных действий плательщика (или его контрагента) по взысканию задолженности. Рост задолженности плательщика (или его контрагента) на фоне продолжения поставки в адрес должника крупных партий товаров или существенных объемов работ (услуг);

Выпуск, покупка/продажа контрагентами векселей, ликвидность которых не очевидна или не исследована, а также выдача/получение займов без обеспечения. При этом негативность данного признака усугубляет отсутствие условий о процентах по долговым обязательствам любого вида, а также сроки погашения указанных долговых обязательств больше трех лет;

Существенная доля расходов по сделке с «проблемными» контрагентами в общей сумме затрат налогоплательщика, при этом отсутствие экономического обоснования целесообразности такой сделки при одновременном отсутствии положительного экономического эффекта от ее осуществления и т.п.

Как проверить компанию-контрагента на «реальность»?

  1. Воспользоваться электронными сервисами на сайте ФНС России (http://www.nalog.ru/) :
  • «Сведения о лицах, в отношении которых факт невозможности участия (осуществления руководства) в организации установлен (подтвержден) в судебном порядке» (https://service.nalog.ru/svl.do ). По ОГРН или ИНН организации можно узнать, не заявляло ли лицо, которое, по сведениям ЕГРЮЛ, является руководителем или учредителем организации, о том, что оно не имеет никакого отношения к ней;
  • «Сведения, опубликованные в журнале "Вестник государственной регистрации", о принятых регистрирующими органами решениях о предстоящем исключении недействующих юридических лиц из Единого государственного реестра юридических лиц (http://www.vestnik-gosreg.ru/publ/fz83/ ). Такое решение налоговая может принять, если компания в течение года не представляла налоговую отчетность и не проводила операций хотя бы по одному банковскому счету. Исключение компании из ЕГРЮЛ приравнивается к ее ликвидации, а значит, она не может заключать и исполнять договоры.

Наш совет: распечатайте или сохраните на своем компьютере интернет-страницы (скриншоты) с информацией о компании. Это поможет в дальнейшем доказать, что вы проводили проверку.

  1. Запросите заверенные копии следующих документов:
  • устава организации;
  • свидетельства о государственной регистрации организации;
  • свидетельства о постановке организации на учет в налоговом органе по месту ее нахождения;
  • решения об избрании (назначении) руководителя организации;
  • паспорта руководителя организации (с. 2, 3);

Кстати: действительность паспорта можно проверить по его серии и номеру, воспользовавшись сервисом «Проверка по списку недействительных российских паспортов» на сайте ФМС России (http://services.fms.gov.ru/info-service.htm?sid=2000 ).

  • лицензии, если сделка с организацией заключается в рамках лицензируемой деятельности. Кроме того, информацию о лицензиях, выданных компании, можно проверить на сайтах лицензирующих органов;
  • бухгалтерской отчетности за год, предшествующий году заключения сделки. Данные бухгалтерской отчетности организации за любой период также можно бесплатно получить в Росстате (при условии, что компания сдает бухотчетность в органы статистики). Для этого нужно направить в любой территориальный орган Росстата запрос по утвержденной форме.

Результаты проведенной проверки можно оформить в виде справки и представить руководителю.

Видеоинструкция по проверке контрагента - на сайте http://egrul.nalog.ru/ .

  • www . fssprus . ru . Официальный сайт Федеральной службы судебных приставов России предоставляет пользователям возможность ознакомиться с банком исполнительных производств и осуществить поиск, используя простую форму (http://fssprus.ru/iss/ip/) (рис. 7).

База данных содержит сведения по юридическим, физическим лицам. Для того чтобы осуществить поиск, необходимо ввести соответственно данные физического, юридического лица или в отдельной вкладке формы поиска - номер исполнительного производства, если он известен (рис. 8).

Обратите внимание! В отличие от сайта Федеральной налоговой службы введение данных о территориальных органах на сайте ФССП является обязательным.

Если компания или физическое лицо имеет какие-либо задолженности и в их отношении возбуждены исполнительные производства, то в результатах поиска ассистент руководителя получит следующие данные: полное наименование компании и адрес местонахождения, номер и дата возбуждения исполнительного производства, реквизиты исполнительного документа, а также сумму непогашенной задолженности. В примере удалены некоторые данные таблицы, однако графы сохранены для наглядности отображения результатов поиска.

  • www . rusprofile . ru . Проект «РусПрофайл» представляет собой справочную систему по компаниям, которой можно воспользоваться для быстрого поиска организации, контактных данных и сведений о регистрации.

В разделе «Компании» необходимо ввести наименование предприятия и получить результаты поиска (рис. 9).

Поиск информации: основные понятия, виды и формы организации

Поиск информации или информационный поиск представляет один из основных информационных процессов. Человечество издревле занималось им, чему свидетельством являются, например, наскальные рисунки. Цели, возможности и характер поиска всегда зависели от наличия, информации, её важности и доступности, а также средств его организации. Совокупность названных факторов обуславливает постановку большинства задач общества, его отдельных групп и личностей в любой период их существования, ибо в социуме передатчиками и приёмниками любых сведений являются индивидуумы. В данном процессе они могут представлять собственные интересы, а также потребности социальной микро (отдельных групп людей) и макросреды (общества в целом).

Конец XX – начало XXI века, характеризуется огромными массивами постоянно растущей разнообразной информации, доступной и представляющей интерес для самых широких слоёв социума. Более того, Интернет-технологии и программно-технические средства, также доступные большинству людей, позволяют осуществлять данный процесс в любое время, практически в любом месте по любым запросам.

Цель любого поиска заключается в потребности, необходимости или желании находить различные виды информации, способствующие получению лицом, осуществляющим поиск, нужных ему сведений, знаний и т.д. для: повышения собственного профессионального, культурного и любого иного уровня; создания новой информации и формирования новых знаний; принятия управленческих решений и т.п.

Всё возрастает важность этих процессов, особенно теперь, когда информация влияет практически на все стороны жизни общества.

По оценке специалистов в Интернете работает 30 и более миллионов пользователей. Из них десятки тысяч – в режиме онлайн (англ. « on - line » – интерактивный доступ в любой момент времени) и количество таких пользователей постоянно (ежедневно) растёт. Всё это затрудняет организацию оперативного поиска и нахождения нужной такому количеству пользователей информации. В этой связи возникает спектр проблем, обусловленных разнообразными возможностями (видами) поиска информации, различными способами их реализации в информационно-поисковых системах (ИПС), разным уровнем знаний пользователей о возможностях таких систем, особенно в области формирования запросов и обработки данных, полученных в результате выполнения этих запросов и т.д. Игнорирование этих аспектов приводит разработчиков к созданию малоэффективных поисковых систем (ПС), а пользователей – к разочарованию в возможностях подобных систем по удовлетворению их информационных потребностей, к неуверенности в собственных знаниях и возможностях работы с ПС и др. Последнее обстоятельство способствует появлению «психологического барьера » (Тема 1) и других негативных проявлений, порой вызывающих у пользователей неприятие НИТ или неуверенность в собственных силах.

Некоторые специалисты предполагают, что в дальнейшем будут созданы ИПС, способные автоматически адаптироваться с учётом уровня знаний и запросов конкретных пользователей, воспринимать запросы на естественном языке и, используя искусственный интеллект, выдавать им не только релевантную, но и пертинентную информацию. В этом направлении постоянно ведутся работы. Однако ещё видимо не одно десятилетие потребуются интеллект и знания конкретных пользователей ИПС или их посредников для эффективного достижения поставленных целей – поиска необходимой информации.

Это вызывает потребность у широкого круга пользователей ПС достаточно хорошо владеть данной предметной областью. Рассмотрим терминологический аппарат, относящийся к проблемам поиска информации.

Существуют различные толкования термина «поиск информации» или «информационный поиск».

Термин «информационный поиск » (англ. « information retrieval ») ввёл американский математик К. Муэрс. Он заметил, что побудительной причиной такого поиска является информационная потребность , выраженная в форме информационного запроса. При этом к объектам информационного поиска К. Муэрс относит документы, сведения об их наличии и (или) местонахождении, фактографическую информацию.

Отметим, что решать проблемы фактографического поиска первыми стали представители библиотек. Они разработали средства информационного поиска, получившие название «справочно-поисковый аппарат » (каталоги, библиографические указатели и др.) . В профессиональной отечественной печати данный термин используется с 1970-х годов.

В «Библиотечной энциклопедии» «информационный поиск » определяется как нахождение в информационном массиве документов , соответствующих информационному запросу пользователей .

С точки зрения использования компьютерной техники под «информационным поиском » подразумевается совокупность логических и технических операций, имеющих конечной целью нахождение документов, сведений о них, фактов, данных, релевантных запросу потребителя .

Существуют и другие определения. В любом случае, информационный поиск вызван потребностью удовлетворения информационных запросов пользователей, ожидающих с помощью ПС оперативно получить необходимые им данные или сведения. Он является методом нацеленного поиска и извлечения релевантных документов и (или) фактов из различных источников информации, например, банков данных или запоминающих устройств. В качестве таковых выступают живые и неживые объекты, представляющие различные носители информации

Системы, обеспечивающие реализацию подобного поиска информации, называются поисковыми системами (ПС). В традиционных технологиях ПС представляют картотеки и каталоги, адресные и иные справочники, указатели, энциклопедии, справочный аппарат к изданиям и другие материалы.

В 1945 годы американский учёный и инженер В. Буш в статье «Возможный механизм нашего мышления» впервые широко поставил вопрос о необходимости механизации информационного поиска. Затем, начиная с 1960 годов, появляются автоматизированные поисковые системы, работающие с информацией. С этого периода ведутся интенсивные работы в области формирования и реализации принципов и методов информационного поиска.

«Поисковые системы » осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова.

Электронные ПС с помощью обычных или интеллектуальных терминалов (ПЭВМ) дают возможность пользователям производить поисковые запросы при помощи формальных и описывающих содержание элементов и с применением специальных логических операторов; осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова. Существуют и другие дефиниции. В любом случае поисковые системы позволяют осуществлять только поисковые процедуры и связанные с ними процессы.

Кочеганова Полина

Методы поиска учебной информации в интернет

Важнейшим условием и ведущим фактором, определяющим успешность учебной деятельности с использованием компьютерных технологий, является готовность учащихся к продуктивной деятельности в дидактической компьютерной среде.

Овладение эффективными методами и средствами поиска, обработки и использования учебной информации дает возможность не только интенсифицировать образовательные процессы, но и развивать познавательные интересы учащихся, стремление к продуктивной, творческой деятельности.

Благодаря повсеместному развитию и применению компьютерных технологий в настоящее время в той или иной электронной форме находится информация всех областей человеческой деятельности: наука, производство, коммерция, литература, развлечения и т.д. Сеть Интернет имеет совместимость с различными электронными сетями и базами данных и позволяет получить удобный доступ практически к любому виду информации.

Информационные ресурсы, доступные через Интернет, огромны. Это десятки миллионов документов, представленных различными способами, число которых постоянно увеличивается. В зависимости от способа представления, вида и характера информации разнятся и методы доступа к ней, поэтому, прежде чем рассматривать методы поиска, рассмотрим классификацию информационных ресурсов.

По принципу организации и использования средства поиска можно разделить на каталоги (справочники, директории) и поисковые машины.

    Каталоги

Каталоги являются справочниками, содержащими списки адресов Интернет, сгруппированные по определенным признакам. Как правило, они объединяются по тематике (наука, искусство, новости и т.д.), где каждая тема разветвляется на несколько подуровней.

Особенность этих средств поиска информации состоит в том, что создание структуры, базы данных и их постоянное обновление осуществляется "вручную", коллективом редакторов и программистов, и сам процесс поиска требует непосредственного участия пользователя, самостоятельно переходящего от ссылки к ссылке.

    Поисковые машины

Действие поисковых машин заключается в постоянном последовательном исследовании всех узлов Интернет, доступных данной системе поиска, со всеми их связями и ответвлениями. В связи с постоянным обновлением информации машина поиска регулярно возвращается через определенный срок (порядка месяца) к уже изученным узлам, чтобы обнаружить и зарегистрировать изменения. Вся прочитанная информация индексируется, то есть создается специализированная база данных, в которой закодированы все исследованные системой страницы Интернет.

При поступлении запроса от пользователя машина поиска рассматривает всю индексированную информацию и выдает список документов, соответствующих задаче поиска. Найденные документы ранжируются в зависимости от местоположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления в тексте.

Несмотря на схожий принцип работы, машины поиска различаются по языкам запроса, зонам поиска, глубине поиска внутри документа, методам ранжирования и приоритетов, поэтому применение разных поисковых машин дает различные результаты.

Более или менее серьезный подход к любой задаче начинается с анализа возможных методов ее решения. Поиск информации в Интернете может быть произведен по нескольким методам, значительно различающимся как по эффективности и качеству поиска, так и по типу извлекаемой информации. В ряде случаев приходится использовать весьма трудоемкие методы - результат того стоит.

Можно выделить следующие основные методы поиска информации в Интернете, которые, в зависимости от целей и задач ищущего, используются по отдельности или в комбинации друг с другом:

    Непосредственный поиск с использованием гипертекстовых ссылок

Поскольку все сайты в пространстве WWW фактически оказываются связанными между собой, поиск информации может быть произведен путем последовательного просмотра связанных страниц с помощью браузера.

Хотя этот полностью ручной метод поиска выглядит полным анахронизмом в Сети, содержащей более 60 млн. узлов, "ручной" просмотр Web-страниц часто оказывается единственно возможным на заключительных этапах информационного поиска, когда механическое "копание" уступает место более глубокому анализу. Использование каталогов, классифицированных и тематических списков и всевозможных небольших справочников также относится к этому виду поиска.

    Использование поисковых машин

Сегодня этот метод является одним из основных и фактически единственным при проведении предварительного поиска. Результатом последнего может являться список ресурсов Cети, подлежащих детальному рассмотрению.

Как правило, применение поисковых машин основано на использовании ключевых слов, которые передаются поисковым серверам в качестве аргументов поиска: что искать. Если делать все правильно, то формирование списка ключевых слов требует предварительной работы по составлению тезауруса.

    Поиск с применением специальных средств

Этот полностью автоматизированный метод может оказаться весьма эффективным для проведения первичного поиска.

Спайдер - это ключевой инструмент для поиска в Web. Как уиомипалось ранее, спайдер представляет собой программу, которая получает некоторые или все ресурсы с большого числа сайтов, главным образом с целью создания инвертированных индексов, которые позднее будут использоваться поисковыми приложениями. Подобно другим Web-клиенгам, спайдер формирует HTTP-запросы для доступа к ресурсам Web-сайта и осуществляет синтаксический анализ ответов. Главными различиями между спайдером и браузером являются гораздо большее число сайтов, к которым осуществляется обращение и посылаются запросы, отсутствие какого-либо отображения ответов и достаточно необычное использование ответов.

На практике, однако, с сайтов может запрашиваться только часть ресурсов. Многие спайдеры, например, не запрашивают изображения или мультимедийные ресурсы. Это делается, если спайдер используется для построения индекса только текстовых ресурсов.

    Анализ новых ресурсов

Поиск по новообразованным ресурсам может оказаться необходимым при проведении повторных циклов поиска, поиска наиболее свежей информации или для анализа тенденций развития объекта исследования в динамике.

Другой возможной причиной может явиться то, что большинство поисковых машин обновляет свои индексы со значительной задержкой, вызванной гигантскими объемами обрабатываемых данных, и эта задержка обычно тем больше, чем менее популярна интересующая тема. Это соображение может оказаться весьма существенным при проведении поиска в узкоспециальной предметной области. Сюда можно отнести, например, работу с социальными сетями, видео-контентом.

Действительно полезные методы поиска учебной информации в Интернет:

    Составление тезауруса

Для эффективного использования поисковых серверов необходим список ключевых слов, организованный с учетом семантических отношений между ними, т.е. тезаурус. При составлении тезауруса необходимо предусмотреть обработку синонимов, омонимов и морфологических вариаций ключевых слов. Не стоит вводить название самой темы.

    Смотрите 2-3-4 страницы поиска

    Отбор поисковых машин

Устанавливается последовательность использования поисковых машин в соответствии с убыванием ожидаемой эффективности поиска с применением каждой машины.

Всего известно около 180 поисковых серверов, различающихся по регионам охвата, принципам проведения поиска (а следовательно, по входному языку и характеру воспринимаемых запросов), объему индексной базы, скорости обновления информации, способности искать "нестандартную" информацию и тому подобное. Основными критериями выбора поисковых серверов являются объем индексной базы сервера и степень развитости самой поисковой машины, то есть уровень сложности воспринимаемых ею запросов.

    Используйте англоязычные ресурсы, даже если не владеете языком. Сегодня технический машинный перевод – это уже не просто набор слов, как было раньше. Хорошие, полезные иностранные сайты переводятся более чем адекватно.

    Используйте специализированные источники поиска учебной информации: e - library , банк диссертаций, киберленинка, сайты архивов и т.д.

Завершая работу, можно прийти к выводу, что в сети Интернет хранится очень большой объем учебной информации по различной тематике в виде статей в электронных газетах, отчетов, справочников, графических изображений, аудио- и видео-файлов и многого другого. Путешествуя по Интернет, можно найти любую информацию, иначе говоря, если какие-либо данные вводились когда-либо в компьютер, то вероятнее всего их можно найти где-то на необозримых просторах Интернет.

Нет такой информации, которую нельзя было бы найти в Интернете, надо просто знать, где и как именно искать.

Список литературы

    Гармашов М. Ю., Коротков А. М. Подготовка учащихся к продуктивной деятельности в дидактической компьютерной среде. - Волгоград, 2001.

    Норенков И.П. Управление знаниями в информационно-образовательной среде. - М.: МЭСИ, 2000.

    Путилов Г.П. Концепция построения информационно-образовательной среды технического вуза. - М.: МГИЭМ, 1999.

    Средства поиска информации в INTERNET // Афанасий-биржа (Тверь). - 28 марта 1997.

    Усков В.Л. Дистанционное инженерное образование на базе Internet / Библиотечка журнала "Информационные технологии", 2000, № 3.

    Демин Игорь Святославович Поиск научной и учебной информации в сети Интернет // Вестник ТГУ. 2008. №9.

Поиск информации - задача, которую человечество решает уже многие столетия. По мере роста объема информационных ресурсов, потенциально доступных одному человеку, были выработаны все более изощренные и совершенные поисковые средства, и приемы, позволяющие найти необходимый документ.

По книге К. Маннинга «Введение в информационный поиск» , можно сказать, что эффективная работа любой ИПС основана на быстроте и возможностях многоаспектной выборки нужных данных из большого массива (поиск информации) для внутренней работы с данными. Это накладывает определённые требования на организацию правил поиска, построение пользовательского и программного интерфейса и формы предоставления информации.

Реализация вышеперечисленных требований возложена на следующий ряд структурных компонентов, так называемых блоков [приложение 4].

По книге Варфоломеева А.А. «Основы информационной безопасности» , в основе выбора именно такой структуры информационно-поисковой системы лежит очень простая логика - любой блок системы должен получать данные, обрабатывать их и выдавать пользователю в определенном порядке, обеспечивая логику процесса.

Невозможно говорить об информационно-поисковых системах, не упомянув про такое понятие, как поисковая машина. Как пишет Д.Н. Колисниченко в книге «Поисковые системы и продвижение сайтов в Интернете» , Поисковая машина - система с формируемой роботом базой данных, содержащей информацию об информационных ресурсах. Отличительной чертой поисковых машин является тот факт, что база данных, содержащая информацию об Web-страницах, формируется программой-роботом. При получении результата, если название и описание документа соответствует вашим требованиям, можно немедленно перейти к его первоисточнику по ссылке. Это удобнее делать в новом окне, чтобы иметь возможность далее анализировать результаты выдачи. Многие поисковые системы позволяют проводить поиск в найденных документах, причем имеется возможность уточнить запрос введением дополнительных терминов. Если интеллектуальность системы высока, то присутствует так же возможность поиска похожих документов. Однако, автоматизация определение похожести - весьма нетривиальная задача, и зачастую эта функция работает не всегда правильно. Некоторые поисковики позволяют провести пересортировку результатов. Стоит обратить внимание на то, что различные поисковые системы описывают разное количество источников информации в интернете. Поэтому нельзя ограничиваться поиском только в одной из указанных поисковых систем. Существуют различные инструменты поиска, которые не формируют собственный индекс, но умеют использовать возможности других поисковых систем. Это, как пишет Н.А. Гайдмамакин в книге «Автоматизированные информационные системы, базы и банки данных» , метапоисковые системы (поисковые службы) - системы, способные послать запросы пользователя одновременно нескольким поисковым серверам, затем объединить полученные результаты и представить их пользователю в виде документа со ссылками.

Так же, Д.Н. Колисниченко пишет, что для наиболее точного и быстрого нахождения необходимой информации в сети, ИПС используют индексирование .

Поисковый индекс - структура данных, которая содержит информацию о документах и используется в поисковых системах.

Индексирование (или индексация), совершаемое поисковой машиной, - процесс сбора, сортировки и хранения данных с целью обеспечить быстрый и точный поиск информации. Создание индекса включает междисциплинарные понятия из лингвистики, математики и информатики.

Популярные поисковые машины сосредотачиваются на полнотекстовой индексации документов, написанных на естественных языках. Мультимедийные документы, такие как видео и аудио и графика также могут участвовать в поиске.

А.Ю. Келина в книге «Основы информационной безопасности» пишет о том, что метапоисковые машины используют индексы других поисковых сервисов и не хранят локальный индекс, в то время как поисковые машины, основанные на кэшированных страницах, долго хранят как индекс, так и текстовые корпусы. В отличие от полнотекстовых индексов, частично-текстовые сервисы ограничивают глубину индексации, чтобы уменьшить размер индекса.

Архитектура поисковой системы различается по способам индексирования. Индексы бывают следующих типов [Приложение 5]:

  • · Прямой индекс. Прямой индекс хранит список слов для каждого документа.
  • · Инвертированный индекс. Хранилище списка вхождений каждого критерия поиска.

Индекс - это только часть поискового аппарата, скрытая от пользователя. Второй частью этого аппарата является информационно-поисковый язык (ИПЯ) , про который подробно пишет Варфоломеев А.А. в книге «Основы информационной безопасности» . ИПЯ- это язык, позволяющий сформулировать запрос к системе в простой и наглядной форме. Если даже пользователю предлагается вводить запросы на естественном языке, то это еще не значит, что система будет осуществлять семантический разбор запроса пользователя. Основная суть заключается в том, что обычно фраза разбивается на слова, из этого списка удаляются запрещенные и общие слова, иногда производится нормализация лексики, а затем все слова связываются либо логическим AND, либо OR.

Возможны и варианты, на что указывает Н.А. Чурсин в книге «Популярная информатика» . Так, в большинстве систем, некоторые фразы будут опознаны как ключевые, и не будет разделяться на отдельные слова. Другой подход заключается в вычислении близости между запросом и документом. К настоящему времени известно около дюжины различных мер близости. Именно эти проценты соответствия документа запросу и выдаются в качестве справочной информации при списке найденных документов.

Наиболее продвинутым языком запросов из современных информационно-поисковых систем Internet, по мнению К. Маннинга , обладает AltaVista. Кроме обычного набора AND, OR, NOT, эта система позволяет использовать еще и NEAR. Последний оператор позволяет организовать контекстный поиск. Все документы в системе разбиты на поля, поэтому в запросе можно указать в какой части документа пользователь хочет увидеть ключевое слово (в ссылке, заголовке и т.п.).

(Для более подробных сведений об информационно-поисковых языках сети интернет см. приложение )

Из книги Ю.И. Кудинова «Основы современной информатики» можно узнать, что наиболее распространенными моделями представления документов в информационно-поисковой системе являются различные вариации на тему представления документа как набора терминов. Как уже упоминалось ранее, это не весь текст документа, а только небольшой набор терминов, который отражает его содержание. Базируясь на таком представлении о документе и нужно рассматривать различные информационно-поисковые языки.

Наиболее распространенным ИПЯ является традиционный язык, позволяющий составить логические выражения из набора терминов. При этом используются булевые операторы AND, OR, NOT.

Такая схема достаточно проста, и поэтому наиболее широко применяется в современных информационно-поисковых системах. Но еще 20 лет тому назад были хорошо известны и ее недостатки.

Булевый поиск плохо масштабирует выдачу. Оператор AND может очень сильно сократить число документов, которые выдаются на запрос. При этом все будет очень сильно зависеть от того, насколько типичными для базы данных являются поисковые термины. Оператор OR напротив может привести к неоправданно широкому запросу, в котором полезная информация затеряется за информационным шумом. Для успешного применения этого ИПЯ следует хорошо знать лексику системы и ее тематическую направленность. Как правило, для системы с таким ИПЯ создаются специальные документально лексические базы данных со сложными словарями, которые называются тезаурусами и содержат информацию о связи терминов словаря друг с другом.

К. Маннинг указывает на то, что модификацией булевого поиска является взвешенный булевый поиск. Идея такого поиска достаточно проста. Считается, что термин описывает содержание документа с какой-то точностью, и эту точность выражают в виде веса термина. При этом взвешивать можно как термины документа, так и термины запроса. Запрос может формулироваться на ИПЯ, описанном выше, но выдача документов при этом будет ранжироваться в зависимости от степени близости запроса и документа. При этом измерение близости строится таким образом, чтобы обычный булевый поиск был бы частным случаем взвешенного булевого поиска.

Но, в отличие от Варфоломеева А.А. , И.С. Ашманов в своей книге «Продвижение сайта в поисковых системах» пишет, что хоть ИПЯ сейчас не совершенны, особое внимание стоит уделять алгоритму ранжирования (упорядоченного выстраивания) полученных ссылок, так как он не менее важен. Наиболее часто используемыми критериями при ранжировании в ИПС являются наличие слов из запроса в документе, их количество, близость к началу документа, близость к друг другу;

Наличие слов из запроса в заголовках и подзаголовках документов (заголовки должны быть специально отформатированы);

Количество ссылок на данный документ с других документов; «респектабельность» ссылающихся документов.

Различные поисковые системы используют различные алгоритмы ранжирования, однако основные принципы определения релевантности следующие:

  • · Количество слов запроса в текстовом содержимом документа (т.е. в html-коде).
  • · Тэги, в которых эти слова располагаются.
  • · Местоположение искомых слов в документе.
  • · Удельный вес слов, относительно которых определяется релевантность, в общем количестве слов документа.

Эти принципы применяются всеми поисковыми системами.

База данных выводит ранжированный подобным образом список документов с HTML и возвращает его человеку, сделавшему запрос. Различные поисковые механизмы также выбирают различные способы показа полученного списка - некоторые показывают только ссылки; другие выводят ссылки c первыми несколькими предложениями, содержащимися в документе или заголовок документа вместе с ccылкой. Ранжирование результатов поиска является неотъемлемой частью информационного поиска.

Аспекты данного понятия хорошо представлены в книге К. Маннинга «Введение в информационный поиск» . Информационный поиск подразумевает использование определённых стратегий, методов, механизмов и средств. Поведение пользователя, осуществляющего управление процессом поиска, определяется не только информационной потребностью, но и инструментальным разнообразием системы - технологиями и средствами, предоставляемыми системой.

Стратегия поиска - общий план (концепция, предпочтение, установка) поведения системы или пользователя для выражения и удовлетворения информационной потребности пользователя, обусловленный как характером цели и видом поиска, так и системными "стратегическими" решениями - архитектурой БД, методами и средствами поиска в конкретной ИПС. Выбор стратегии в общем случае является оптимизационной задачей. На практике в значительной степени он определяется искусством достижения компромисса между практическими потребностями и возможностями имеющихся средств.

Метод поиска - совокупность моделей и алгоритмов реализации отдельных технологических этапов: построения поискового образа запроса, отбора документов (сопоставление поисковых образов запросов и документов), расширения запроса, локализации и оценки выдачи.

Поисковый образ запроса - записанный на ИПЯ текст, выражающий смысловое содержание информационного запроса и содержащий указания, необходимые для наиболее эффективного осуществления информационного поиска.

Процесс поиска информации представляет последовательность шагов, приводящих при посредстве системы к некоторому результату, и позволяющих оценить его полноту. Так как пользователь обычно не имеет исчерпывающих знаний об информационном содержании ресурса, в котором проводит поиск, то оценить адекватность выражения запроса, равно как и полноту получаемого результата, он может, основываясь лишь на внешних оценках или на промежуточных результатах и обобщениях, сопоставляя их, например, с предыдущими.

Процесс поиска можно представить в виде следующих основных компонентов:

  • 1) формулирование запроса на естественном языке, выбор поисковых системы и сервисов, формализация запроса на соответствующем ИПЯ;
  • 2) проведение поиска в одной или нескольких поисковых системах;
  • 3) обзор полученных результатов (ссылок);
  • 4) предварительная обработка полученных результатов: просмотр содержания ссылок, извлечение и сохранение релевантных данных;
  • 5) при необходимости, модификация запроса и проведение повторного (уточняющего) поиска с последующей обработкой полученных результатов.

Для уменьшения объёма отобранных материалов осуществляют фильтрацию результатов поиска по типу источников (сайтов, порталов), тематике и другим основаниям.

По используемым поисковым технологиям ИС можно разбить на 4 категории:

  • 1. Тематические каталоги;
  • 2. Специализированные каталоги (онлайновые справочники);
  • 3. Поисковые машины (полнотекстовый поиск);
  • 4. Средства метапоиска.

Тематические каталоги предусматривают обработку документов и отнесение их к одной из нескольких категорий, перечень которых заранее задан. Фактически это индексирование на основе классификации. Индексирование может проводиться автоматически или вручную с помощью специалистов, просматривающих популярные веб-узлы и составляющих краткое описание документов-резюме (ключевые слова, аннотация, реферат).

Специализированные каталоги или справочники создаются по отдельным отраслям и темам, по новостям, по городам, по адресам электронной почты и т. п.

Поисковые машины (самое развитое средство поиска в Интернете) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на опрашиваемых серверах. Индекс может содержать информацию о нескольких миллионах документов.

При использовании средств метапоиска запрос осуществляется одновременно несколькими поисковыми системами. Результат поиска объединяется в общий, упорядоченный по степени релевантности список. Каждая система обрабатывает только часть узлов сети, что позволяет расширить базу поиска.

Так же очень важна так называемые «организация поиска» и «реализация поиска», о чем пишет Д.Н. Колисниченко в книге «Поисковые системы и продвижение сайтов в Интернете» .

Организация поиска

Процедура поиска необходимой информации разделяется на девять основных этапов:

  • · Определение области знаний;
  • · Выбор типа и источников данных;
  • · Сбор материалов необходимых для наполнения информационной модели;
  • · Отбор наиболее полезной информации;
  • · Выбор метода обработки информации (классификация, кластеризация, регрессионный анализ и т.д.);
  • · Выбор алгоритма поиска закономерностей;
  • · Поиск закономерностей, формальных правил и структурных связей в собранной информации;
  • · Творческая интерпретация полученных результатов;
  • · Интеграция извлеченных "знаний".

Для проведения поиска первоначально на компьютере пользователя загружается интерфейс работы с соответствующей БД. Это может быть локальная или удалённая БД. Первоначально следует определиться с видом поиска (простой, расширенный и т.д.). Затем с набором предлагаемых для поиска полей. ИПС могут предложить для ввода одно или несколько полей. В последнем случае это обычно поля: автора, заглавия (названия), временного периода, вида документа, ключевых слов, рубрик и др.

Реализация поиска

Общепринята организация поиска по начальным фрагментам слова (поиск с усечением справа), например, вместо слова "библиотечный" можно ввести его фрагмент "библиоте*". При этом будут найдены документы, в которых содержится не только слово "библиотечный", но и "библиотека", "библиотекарь", "бибилотековедение" и др. В каждом случае пользователь должен представлять, что именно он хочет найти, так как в предложенном ему варианте будет найдено гораздо большее количество документов, чем при задании данного слова полностью (без усечения). В подобном случае возможно в полученном массиве информации провести уточняющий поиск и в результате получить более релевантные данные.

ИПС характеризуются также временем выполнения поиска, интерфейсом, предоставляемым пользователю и видом отображаемых результатов. При выборе ИПС обращают внимание на такие их параметры, как охват и глубина. Под охватом понимается объём базы поисковой машины, измеряемый тремя показателями: общим объёмом проиндексированной информации, количеством уникальных серверов и количеством уникальных документов. Под глубиной понимается - существует ли ограничение на количество страниц или на глубину вложенности директорий на одном сервере.

Так же, некоторые аспекты информационного поиска освещены в книге В.А. Гвоздевой «Основы построения автоматизированных информационных систем» . Как написано в книге, каждая поисковая машина имеет свои алгоритмы сортировки результатов поиска. Чем ближе к началу списка, полученного в результате проведения поиска, оказывается нужный документ, тем выше релевантность и лучше работает поисковая машина. Все они позволяют по ключевым словам, тематическим рубрикам и даже отдельным буквам оперативно находить в сети, например, все или почти все тексты, где эти слова присутствуют. При этом пользователю сообщаются адреса сайтов, где найденные результаты постоянно присутствуют. Однако ни одна из них не имеет подавляющих преимуществ перед другими. Для проведения надежного поиска по сложным запросам специалисты рекомендуют использовать последовательно или параллельно (одновременно) различные ИПС.

Из книги Д.Н. Кадеева «Информационные технологии и электронные коммуникации» можно узнать о таком понятии, как «полнотекстовая поисковая машина». Она индексирует все слова видимого пользователю текста. Наличие морфологии дает возможность находить искомые слова во всех склонениях или спряжениях. Некоторые машины умеют искать словосочетания или слова на заданном расстоянии, что часто бывает важно для получения разумного результата. Кроме этого, в языке HTML существуют тэги, которые также могут обрабатываться поисковой машиной (заголовки, ссылки, подписи к картинкам и т.д.). При этом необходимо знать, что чем меньше количество ключевых слов включено в эти теги, тем с большей частотой они могут встречаться в текстах страниц сайта и, следовательно, тем выше их релевантность. Оптимальным считается частота таких слов не более 5%. Ключевых слов должно быть не очень много, они в большей степени должны состоять из одного или двух слов, образуя наиболее употребляемые термины. Чем большую релевантность имеют ключевые слова, тем большую конкурентоспособность они придают документу с точки зрения поисковых машин.

Полноту и точность ответа пользователь получает в зависимости от точности сформулированного им запроса. В результате поиска ему обычно предоставляется гораздо больше информации, чем ему необходимо, часть которой может вообще не иметь отношение к сформированному запросу. Легко заметить, что многое зависит не только от грамотно сформулированного запроса, но и от возможностей поисковых систем, которые весьма различны. При этом достаточно ярко проявляется тот факт, что в полученных данных можно пропустить главные, необходимые сведения. Простые запросы в виде отдельных достаточно распространенных терминов приводят к извлечению тысяч (сотен тысяч) документов, абсолютное большинство которых пользователю не требуется (информационный шум ).

Важным аспектом также является возможность ИПС поддерживать многоязычность, то есть способность обрабатывать запросы на различных языках. Так же, обычно поиск в полнотекстовых БД осуществляется с использованием морфологических анализаторов (как правило, русских и английских), позволяющих автоматически находить существующие словоформы по фрагменту слова, слову, фразе, даже если в словах запроса присутствуют некоторые опечатки.

Ещё, нельзя не упомянуть про такую особенность ИПС, как средства поиска и структурирования , иногда называемые поисковыми механизмами . Как пишет И.С. Ашманов в своей книге «Продвижение сайта в поисковых системах» , поисковые механизмы используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет собственный набор правил, определяющих, как находить и обрабатывать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие проинструктированы, что нужно просматривать прежде всего наиболее популярные страницы. Классификация поисковых механизмов лучше всего представлена в книге Варфоломеева А.А. «Основы информационной безопасности” :

  • · Агенты - самые "интеллектуальные" из поисковых средств. Они могут делать больше, чем просто искать: они могут выполнять даже транзакции от Вашего имени. Уже сейчас они могут искать cайты специфической тематики и возвращать списки cайтов, отсортированных по их посещаемости. Агенты могут обрабатывать содержание документов, находить и индексировать другие виды ресурсов, не только страницы. Они могут также быть запрограммированы для извлечения информации из уже существующих баз данных. Независимо от информации, которую агенты индексируют, они передают ее обратно базе данных поискового механизма.
  • · Общий поиск информации в Сети осуществляют программы, известные как пауки . Пауки сообщают о содержании найденного документа, индексируют его и извлекают итоговую информацию. Также они просматривают заголовки, некоторые ссылки и посылают проиндексированную информацию базе данных поискового механизма.
  • · Кроулеры просматривают заголовки и возвращают только первую ссылку.
  • · Роботы могут быть запрограммированы так, чтобы переходить по различным ссылкам различной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе. Из-за их природы они могут застревать в циклах, поэтому, проходя по ссылкам, им нужны значительные ресурсы Сети, однако, имеются методы, предназначенные для того, чтобы запретить роботам поиск по сайтам, владельцы которых не желают, чтобы они были проиндексированы.

В завершение можно сказать, что ИПС в сети, при всем их внешнем разнообразии, своей классификацией, которая описана в книге Л.Г. Гагариной «Автоматизированные информационные системы» :

Классификационные информационно-поисковые системы

В классификационных ИПС используется иерархическая (древовидная) организация информации, которая называется КЛАССИФИКАТОРОМ. Разделы классификатора называются РУБРИКАМИ. Библиотечный аналог классификационной ИПС - систематический каталог. Классификатор разрабатывается и совершенствуется коллективом авторов. Затем его использует другой коллектив специалистов, называемых СИСТЕМАТИЗАТОРАМИ. Систематизаторы, зная классификатор, читают документы и приписывают им классификационные индексы, указывающие, каким разделам классификатора эти документы соответствую.

Предметные ИПС (Web-кольца)

Предметная ИПС с точки зрения пользователя устроена наиболее просто. Ищи название нужного предмета своего интереса (предметом может быть и нечто невещественное, например, индийская музыка), а с названием связаны списки соответствующих ресурсов Интернет. Это было бы особенно удобно, если полный перечень предметов невелик.

Словарные ИПС

Культурные проблемы, связанные с использованием классификационных ИПС, привели к созданию ИПС словарного типа, с обобщенным англоязычным названием search engines . Основная идея словарной ИПС - создать словарь из слов, встречающихся в документах Интернет, в котором при каждом слове будет храниться список документов, из которых взято данное слово.

Основываясь на сведениях из книги А.Ю. Келиной «Основы информационной безопасности» , можно выяснить что есть два основных алгоритма работы словарных ИПС: с использованием ключевых слов и с использованием дескрипторов (Дескриптор - лексическая единица (слово, словосочетание) информационно-поискового языка, служащая для описания основного смыслового содержания документа или формулировки запроса при поиске документа (информации) в информационно-поисковой системе ). В первом случае, для оценки содержимого документа используются только те слова, которые в нем встречаются, и по запросу ИПС сопоставляет слова из запроса со словами документа, определяя по количеству, расположению, весу слов из запроса в документе его релевантность. ИПС по историческим причинам используют этот алгоритм, в различных модификациях.

1 ОБЩИЕ ПРИНЦИПЫ ОРГАНИЗАЦИИ ПОИСКА ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

1.1 Поиск информации в Интернет: стратегия и методика

Поиск информации является одной из наиболее распространенных и одновременно наиболее сложных задач, с которыми приходится сталкиваться в Сети любому пользователю. Причина сложностей, возникающих при информационном поиске в Интернет, определяется двумя главными факторами. Во-первых, число источников в Сети чрезвычайно велико. Во-вторых, массив информации в Сети не только колоссален по объему, но еще и крайне динамичен. За те полминуты, что мы потратим на чтение первых строк этого раздела, в виртуальной вселенной появится порядка сотни новых или измененных документов, десятки будут перемещены на новые адреса, а единицы - навсегда прекратят свое существование.

Необходимость и важность проблемы информационного поиска привела к образованию в самом Интернет целой отрасли, задача которой заключается именно в оказании помощи пользователю в его навигации в киберпространстве. Составляют эту отрасль специальные поисковые службы или сервисы. Условно их можно разделить на кaтaлoги (dirесtоriеs) и пoиcкoвыe мaшины (sеаrсh еnginеs).

Эти разновидности внешне очень похожи, поскольку каждый каталог, как правило, обладает собственной поисковой машиной, а каждая поисковая машина - собственным каталогом. Однако принципы их работы базируются на абсолютно разных подходах и технологиях. Каждый из этих инструментов имеет определенные преимущества, а основная разница между ними заключается в участии/неучастии человека. Поисковые машины запускают в Web программных «пауков» (spiders), которые путешествуют со страницы на страницу и на каждой индексируют ее полный текст. Каталоги же формируются людьми-редакторами, которые прочитывают страницы, отсеивают неподходящие и классифицируют узлы по темам. При этом каждая разновидность поисковых сервисов применяется для решения определенного типа задач. Правильным выбором инструмента во многом определяется стратегия поисковой деятельности и, в конечном итоге, результат разысканий.

Приступая к информационному поиску в Интернет, следует всегда помнить несколько основных моментов. Прежде всего, никакие средства навигации - каталоги или поисковые машины - не охватывают всего текущего информационного массива Интернет. По некоторым оценкам, даже такие признанные лидеры сетевого поиска как Google, отражают не более трети совокупного содержания Сети. Причина этого - постоянный колоссальный прирост объемов информации в Интернет, который, несмотря на все усилия навигационных служб, содержит огромное число белых пятен.

Помимо быстрого роста и изменения местоположения документов, большинство поисковых систем имеют внутренние ограничения на отражение материалов одного сайта и на объем индексируемой части страницы. Программы-роботы зачастую не идут в глубь сервера дальше определенной директории, что также сокращает число отраженных материалов.

В тоже время многие крупные сайты имеют собственную систему поиска, которая отражает весь их информационный массив. Выявив такие сервера с помощью каталогов, можно провести более детальное их обследование, использовав локальный поисковый механизм. Таким образом, для достижения наиболее полных результатов следует применять каталоги и поисковые машины в сочетании друг с другом.

Существует также ряд общих требований к поисковой деятельности, соблюдение которых повышает эффективность и экономит время, затрачиваемое на разыскание данных.

1. Для поиска материалов по крайне узкой специфической тематике стоит начинать с каталогов.

2. Для получения более полных результатов по сложному запросу поиск рекомендуется проводить отдельно в каждой поисковой машине. Поисковые системы имеют сильный разнос в отражении документов и их последовательное использование в значительной степени расширяет охват материала.

3. При разыскании документов об отдельной стране или на конкретном языке следует отдать предпочтение национальным/региональным поисковым средствам.

4. Формировать запрос надо максимально точно, используя все возможности механизма составления запроса. Затраты времени на детальное составление поискового предписания окупаются при анализе результатов поиска. При точном формировании запроса процент информационного шума будет намного ниже.

При систематическом обращении к поисковым средствам, необходимо постоянно следить за новостями, относящимися к поисковому сервису. В окружающем нас мире вообще, а в цифровом мире тем более, нет ничего вечного. Каждая поисковая система переживает периоды зарождения, расцвета и упадка. Не бойтесь отказаться от использования любимой, но устаревающей поисковой системы и перейти на использование новых поисковых инструментов, обладающих большей эффективностью.

1.2 Поиск с помощью каталогов

1.2.1 Принцип работы, преимущества и недостатки каталогов

Каталоги – это пионеры навигации в Сети. Каталог представляет собой данные, структурированные по темам в виде иерархических структур. Пpи зaгpузкe кaтaлoгa нa экpaн вывoдитcя caмый oбщий пepечeнь oблacтeй чeлoвeчecкoй дeятeльнocти: ИCКУCCTВO, OБPAЗOВAHИE, БИЗHEC, HAУKA, ИГPЫ, CПOPT и т.д. Каталоги имеют иерархическую структуру, то есть пользователь, входя в любой раздел каталога, последовательно видит все более и более дробную его детализацию. Бoльшинcтвo кaтaлoгoв сoздaются путeм дoбaвлeния aвтopaми wеb-cтpaниц cвoeгo сaйтa к сущecтвующeму cпиcку ccылoк.

Поисковые кaтaлoги coздaются вpучную, т.e. инфopмaция в них зaнoсится людьми. Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что по их мнению представляет общественный интерес, и заносят в каталог. Благодаря "человеческому" фактору, информация в каталогах организована достаточно четко, что позволяет в определенных случаях достичь требуемого результата быстрее, чем при помощи поисковых машин. Основной проблемой поисковых каталогов является чрезвычайно низкий коэффициент охвата ресурсов WWW. В каталоги попадают лишь лучшие страницы. Поэтому найти достаточно специфическую информацию в каталоге зачастую очень сложно.

Кроме основных разделов многие каталоги имеют дополнительные, в которых сайты классифицированы по другому основанию: региону, стране; алфавиту; популярности.

Особенность каталогов в том, что они более эффективны при поиске подборок информации на определенную общую тему, например, «профсоюзное движение», «редакции газет Урала», а не при поиске ответа на конкретный вопрос!

Каталоги могут быть:

· универсальными, которые позволяют производить поиск по различным темам. Информация сгруппирована по разделам. Каждый раздел имеет несколько подразделов. Например, www.ru, referal.ru, www.freeedom.ru.


Windows у каждого DOS-приложения было собственное руководство пользователя и тем самым требовалось отдельно изучать каждое приложение. 2 ОСНОВНЫЕ ПРИЕМЫ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ 2.1 Основные требования к поиску К результатам поиска предъявляются требования полноты охвата ресурсов, достоверности полученной информации, минимальных затрат времени и максимальная скорость поиска. ...

Информацию, используя выделенные тематические разделы (предметные каталоги) в поисковых машинах. Такой способ поиска информации в Интернете осуществляется по виду библиотечного каталога. Например, если необходимо найти информацию о начислении амортизации основных средств, следует обратиться к разделу "Бухгалтерский учет". В нем выбрать раздел "Основные средства". А в разделе "Основные средства" - ...

С использованием флажков, которые расположены на данной странице. Система так же имеет возможность перехода по ссылкам. ГЛАВА 2. УЧЕТ РАСЧЕТОВ И ТЕКУЩИХ ОБЯЗАТЕЛЬСТВ С ПОКУПАТЕЛЯМИ И ЗАКАЗЧИКАМИ При поиске информации по теме «Учет текущих обязательств и расчетов с покупателями и заказчиками» были использованы такие поисковые системы как http://www.altavista.com, http://www.aport.ru, http:// ...

Образовательные ресурсы www.spb. osi.ru/ic/distant Дистанционное обучение в Интернет www.examen.ru Экзамены и тесты www.kbsu.ru/~book/ Учебник информатики Mega. km.ru Энциклопедии и словари Поиск информации в Интернете: подводные камни Проблемы, не лежащие на поверхности, нередко дают о себе знать лишь "задним числом", после того как определенный этап поисковых работ завершен и, ...