image1 image2 image3 image1

: Главная Журналистика и интернет Составление запросов для систем линейного поиска



Составление запросов для систем линейного поиска
Теория журналистики - Журналистика и интернет

составление запросов для систем линейного поиска

Работа с линейными поисковыми системами подразумевает определенные навыки в составлении запроса. Традиционные языки запросов подразумевают выбор ключевых слов, указание на их обязательное наличие или отсутствие в текстах, положение ключевых слов относительно структуры текста (например, в заголовке или в самом теле документа) и относительно друг друга (расстояние между словами, последовательность употребления, жесткость словосочетаний, нахождение внутри одного предложения, одного документа и пр.).

В профессиональных системах линейного, или универсального, поиска возможности дополнительных параметров значительно расширены. Например, в системе «Гарант» реализована уникальная технология поиска через «Энциклопедию ситуаций». Пользователь формулирует запрос, используя привычные ему термины, система «переводит» запрос и в течение нескольких минут предоставляет ответ. В «Интегруме» реализованы следующие уникальные возможности – поиск с опечатками или вариантами написания, поиск по фамилии, имени, отчеству, когда умная система находит в текстах все формы употребления фамилии, имени, отчества, которые могут соответствовать заданному, даже уменьшительные. Например, если вы ищете человека с фамилией Александров и инициалами А.Ю., то, задав эти параметры при поиске с включением нужной функции, получите документы, где упоминается Шурик Александров, Алексей Юрьевич Александров, Антон Александров, Александров Автандил Юлианович, А. Александров и т.д.

В материалах проекта «Гардарика» поисковикам рекомендуется составлять тезаурусы в зависимости от конкретных интересов и пополнять их постоянно, по мере выявления новых терминов в ходе работы. Более адекватной представляется структура тезауруса в виде семантических срезов, где для каждого основного термина отдельно строится таблица сопутствующих слов и слов шумовых (которые не должны встречаться в источнике). Это весьма актуально для журналистов, работающих по одной теме, но, прежде всего этот совет относится к пользователям общедоступных поисковых систем. Профессиональные системы более специализированы и поэтому могут предложить пользователю готовые тезаурусы и типовые запросы.

 

 


Читайте:


Добавить комментарий


Защитный код
Обновить

Основы журналистики:

Рецензия на...или как это делать

News image

В переводе с латинского языка слово «рецензия» означает «оценка, отзыв о чем-либо».

Очерки

News image

Очерк – один из важнейших жанров публицистики. Важнейших – потому что требует от автора высокого профессионального мастерства.

Три источника и три составные части новости

News image

Газета «Нью-Йорк Таймс» провозглашает в своем редакционном девизе, что она «печатает все новости, пригодные для публикации».

Интервью от журналиста:

Константин Эрнст: `Эра `цифрового` телевидения кончилась`

News image

В 2006-м уж особенно часто доводилось слышать: совсем нечего смотреть!

Читать...

Всеволод Богданов: Практически все журналистские убийства являются зак

News image

В понедельник Международный комитет защиты журналистов признал Россию одной из самых опасных стран для работы СМИ.

Читать...

Всеволод Богданов: `Свободу журналист определяет для себя сам`

News image

На днях в Дагомысе завершился двенадцатый фестиваль журналистики, ставший в этом году международным.

Читать...

Дмитрий Губин

News image

Dmitry Gubin

Иван Александрович Баженов

News image

Ivan Bazhenov ( 12.10.1846 года - 27.10

Владимир Познер

News image

Владимир Познер родился 1 апреля 1934 года в Париже.- Мать – Жеральдин Люттен, гражданка Франции.

Роберт Блэтчфорда

News image

Robert Blatchford ( 17.03.1851 года - 17.12

Алексей Аджубей

News image

Alexey Adjubey ( 09.01.1924 года - 19.03

Павел Николаевич Гусев

News image

Pavel Gusev (04.04.1949 года [Москва]) Россия (Russia)