Назад в библиотеку

Поиск сегодня и завтра: оптимизация для Web

Автор: KERSTIN RECKER

Аннотация

KERSTIN RECKER - Поиск сегодня и завтра: оптимизация для Web В статье рассматриваеться вопрос использования семантического поиска в поисковой системе

Поиск сегодня и завтра: оптимизация для Web

Интернет поиск резко изменился за прошедший год и семантическая технология была в центре всего этого. Эта эволюция поиска имеет драматические последствия для маркетологов, потребителей, разработчиков и создателей контента - и это только начало для быстро меняющейся среды интернета. Вот краткий обзор того, как технология поиска меняется, как эти изменения могут повлиять на вас и что вы можете сделать, чтобы более эффективно продать свой бизнес в новую эру поиска.

В поисковых системах, семантический поиск (также известный как "поиск объекта") использует искусственный интеллект для определения смысла слов, так поиск стал более актуальным. Семантическая технология постепенно вводиться в последние годы, предлагая пользователям более легкий доступ к информация и соединения с тем что они ищут. Даже не зная, потребители используют больше естественной речи в их поисковых запросов, и ожидают, чтобы их поняли и дали ответ на их запрос.

Нет больше сосредоточенности на просто слове или фразе, интернет поиск начал использовать новый уровень сложности, так называемый семантический поисковик. Отныне, поисковик будет в состоянии искать на основе "объекта"; Таким образом поисковик покажет гораздо больше о том что вы запросили, чем это было возможно раньше. Например, вместо того, чтобы просто направлять вас на известного современного человека, которого вы ищите, запрос будет показывать все ссылки на этого человека, которые с ним связаны.

Новый алгоритм "Колибри" от Google позволяет пользователю получать то, что Google называет "разговорные" поиски. То есть то, что поисковая система примет, весь текст во внимание и не только слова в предложении. Таким образом, вместо направляя вас до ближайшего ресторана пиццы, вы будете направлены на ближайшие пиццерии, которые открыты в настоящее время, имеют специальные ингредиенты, которые вы хотите. Поисковая система стремится понять не только слова, но их контекст, отсюда и термин семантический поиск.

Какую проблему мы пытаемся решить?

Первая сложность возникает, когда семантический поиск начинают считать решением всевозможных задач – от современной системы поиска, где доминирует Google, до задач, которые нельзя решить вычислительным путем. Все еще более усложняется тем, что в настоящее время есть лишь несколько областей знания, где семантический поиск действительно справляется лучше — это сложные запросы о выводах и рассуждениях о сложных системах данных

Как видно из приведенных данных, Google легко справляется с основными видами запросов. К сожалению, автоматическая обработка естественного языка дает в этом лишь небольшое преимущество. Google даст верный ответ на вопрос о годе рождения Леонардо, не предоставляя никаких шансов усовершенствовать процесс поиска пониманием существительных и глаголов, которые вбивает пользователь в строку поиска. Перед тем, как рассмотреть задачи, с которыми легко справляется семантический поиск, рассмотрим самые сложные задачи. Существуют требующие вычисления задачи, которые не имеют ничего общего с пониманием семантики слова. На ранней стадии существования Семантического Веба бытовало мнение, что с его помощью мы сможем решать даже сверхсложные задачи, но, к сожалению это не так. Есть пределы того, что мы можем вычислить, и есть класс задач с огромным числом возможных решений, и мы не можем волшебным способом решить эти задачи только потому, что представили информацию в RDF.

Но есть также и пласт задач, с которыми семантический веб справляется великолепно. Мы решали их при помощи тематической базы данных. Но не стоит забывать, что семантические технологии помогают нам отыскать тематическую информацию, рассредоточенную по всей сети – потому для нас нет ничего удивительного в том, что семантические поисковые системы превзойдут тематические запросы.

Обзор семантических поисковых систем

Суть семантического поиска не только в вопросах, задаваемых нами. По причине того, что веб – это набор неструктурированных HTML-страниц, в основе семантического поиска лежит еще и базовая информация. Самой четкой и понятной из всех мы нашли Freebase – семантическая база данных. Freebase работает не только через текстовый поиск, а что наиболее важно, и через — MQL (Metaweb Query Language). MQL это почти тот же JSON (текстовый формат обмена данными), но с более широкими возможностями. С его помощью вы можете составить любой запрос в Freebase и ответом будет тот же запрос, но уже со вставленными результатами поиска.

Powerset, по сути, это тематическая база данных, которая работает с определенной структурированной информацией. С другой стороны есть Google, который в первую очередь ориентируется на статистическую частоту запросов и почти не принимает во внимание семантику. Вызывает интерес новая система SearchMonkey от Yahoo! Эта система ничего не добавляет к найденным результатам, но использует семантические аннотации для более полного, интерактивного и полезного пользовательского интерфейса. Компании Hakia и Powerset явно работают с максимальной отдачей. Они пытаются создать подобные Freebase структуры, а потом по топовым результатам провести поиск на естественном языке. Отличие в том, что Hakia (как и другие) использует технологию для поиска по всей сети, а Powerset замкнул свой поиск на Wikipedia.

Выводы

Семантический поиск – это технология будущего, поставившая перед собой слишком высокие цели. Все мы думали, что он поможет свергнуть Google и предоставить наиболее качественные результаты поиска. Оба эти утверждения оказались ложными. Правда в том, что семантический поиск — явление многофакторное, и он поможет нам решать те задачи, которые мы не можем решить сейчас: сложные, логически обоснованные запросы, которые сплошь и рядом встречаются в сети. Для того, чтобы технологии семантического поиска заняли свою нишу на рынке, компаниям необходимо пересмотреть поставленные цели и улучшить пользовательский интерфейс. Поисковая строка не актуальна и сулит убытки, т.к. она ассоциируется с простыми вопросами, с которыми легко справляется Google. Разработчикам необходимо предложить совершенно новый интерфейс, чтобы пользователи смогли полностью ощутить всю мощь семантического поиска.