В этом разделе размещены ссылки на Интернет сайты, материалы которых, связаны
с
моей будущей выпускной работой.
Поисковые технологии, новинки
- http://www.searchengines.ru/
Сайт посвящен поисковым технологиям, новостям и новинкам в области поиска.
- http://www.wolframalpha.com/
По словам разработчика, его поисковая
система способна понимать вопрос на «человеческом» языке и рассчитать правильный
ответ при помощи математических и других формул. По отзывам аналитиков, Wolfram
Alpha демонстрирует потрясающие результаты. Он не просто находит готовые ответы
в базе, а по-настоящему анализирует запрос, действуя подобно искусственному интеллекту.
-
http://serchengine.ru/
Страница, посвящена новостям поисковых систем, новинкам программного обеспечения в области поиска, а также комметнариям
- http://www.seochat.com/
Сайт посвящен оптимизации поиска, сайт содержит мощный новостной раздел, доступны тестовые формы для проверки сайтов и ключевых слов.
-
http://www.seo-study.ru/
Обучение SEO,поисковая оптимизация, новости и статьи, курсы, аналитика рынков
- http://www.bing.com/
Новый поисковик от Microsoft вобрал все лучшее из всех возможных технологий поисквиков, очень прост в использовании и не перегружен
-
http://www.unilib.neva.ru/dl/747/pm.htm
Список бесплатных поисковых машин, систем поиска, и поисковых каталогов
- http://itqiz.com
Cистема автоматического исправления поисковых опечаток связанных с неправильно выбранной клавиатурной раскладкой.
-
http://www.freefind.com/
Сервис позволяет добавить движок поисковика на существующую страницу интренет.
- http://www.searchengineshowdown.com/
Путеводитель по поисковым системам. Сайт содержит новости, обзоры, статистики поисковых систем.
-
http://www.osp.ru/os/1996/03/178885/
Информационно-поисковые системы Internet, обзоры и принцип работы
-
http://company.yandex.ru/articles/antispam.xml
Автоматические методы детектирования спама.
-
http://www.securelist.com/ru/
Технологии детектирования спама.
Теория поисковых систем: Конференции, группы, семинары
-
http://www.sigir.org/
Специальная научная группа, интересами которой являются вопросы из области поиска информации.
-
http://trec.nist.gov/
Страница посвящена научным конференциям, охватывающим все вопросы поиска информации
-
http://www9.org
Страница посвящена конференциям паутины WWW, содержит также материалы по различным вопросам поиска информации
-
http://www.protvino.ru/dl2000/
Электронные библиотеки: перспективные методы и технологии, электронные коллекции. Содержит материалы касающиеся таких тем, как: тезаурусы, лингвистика, индксирование и поиск текстов и изображений.
-
http://romip.narod.ru/
Российский семинар по Оценке Методов
Информационного Поиска. Целью семинара является создание плацдарма для проведения независимой оценки методов информационного поиска, ориентированных на работу с русскоязычной информацией, а также консолидация сообщества российских исследователей и разработчиков, занимающихся информационным поиском.
-
http://www.aot.ru/index.html
Рабочая группа Aot.ru разрабатывает программное обеспечение в области автоматической
обработки текста. В круг наших интересов в основном входит анализ русского языка.
-
http://svmlight.joachims.org/
Официальная страница разработчиков алгоритма SVM
-
http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html
Официальная страница книги
Introduction to Information Retrieval.
-
http://itman.narod.ru/ir/faq/fzfaq_calc.html
Алгоритм определения подобия документов.
-
http://www.gpntb.ru/win/inter-events/crimea2001/tom/sec3/Doc17.HTML
Методы автоматического создания тематических каталогов информационных ресурсов Internet
для информационно-библиотечных систем
-
http://itman.narod.ru/
Этот сайт посвящен информационному поиску и поиску по сходству.
- http://rabchevsky.name/taxonomy/term/7
Домашняя страница Рабчевского Е.А. Содержит ценные материалы, касающиеся вопросов поиска.
Латентно-семантический анализ
- http://wordnet.princeton.edu/
WordNet® is a large lexical database of English, developed under the direction of George A. Miller. Nouns, verbs, adjectives and adverbs are grouped into sets of cognitive synonyms (synsets), each expressing a distinct concept. Synsets are interlinked by means of conceptual-semantic and lexical relations.
- http://wordnet.wordmind.com/
Страница, на которой реализован механизм WordNеt. Позволяет понять смысл слова, через его контекст, и примеры использования. Версия для английского языка.
- http://plwordnet.pwr.wroc.pl/browser/index.jsp
Страница, на которой реализован механизм WordNet. Позволяет понять смысл слова, через его контекст, и примеры использования. Версия для польского языка.
- http://wordnet.ru/
Страница, посвященная русской версии WordNet, тут доступны библиотеки и готовые программы.
-
http://www.ruscorpora.ru/
На этом сайте помещен корпус современного русского языка объемом более 140
млн слов. Корпус русского языка — это информационно-справочная система, основанная
на собрании русских текстов в электронной форме.
-
http://www.artint.ru/projects/frqlist.asp
На этой странице Вы можете получить списки наиболее частых слов русского языка.
До настоящего времени Частотный словарь русского языка под ред. Л.Н.Засориной (1977)
чаще всего использовался в качестве источника информации о частоте русских слов.
-
http://forum.searchengines.ru/showthread.php?postid=7670
Список стоп-слов для русского языка. -
http://rusgram.narod.ru/
Грамматика русского языка, фонетика, словообразование, морфология, синтаксис. -
http://www.rusf.ru/books/analysis/
На этой Web-странице демонстрируются возможности математического анализа структуры текста. Целью анализа является определение близости любого из предлагаемых пользователем Интернета текста к одному из авторских эталонов, определенных заранее.
-
http://company.yandex.ru/technology/mystem/
Программа mystem производит морфологический анализ текста на русском языке. Для
слов, отсутствующих в словаре, порождаются гипотезы.
-
http://www.analyst.ru/
Сервис, позволяющий анализировать тексты на английском и русском языках. -
http://www.retrans.ru/index.php
В рамках проекта RETRANS выполняются научные исследования и разработки в области компьютерной лингвистике и перспективных информационных технологий
-
http://mechanoid.narod.ru/nns/classifier-text/index.html
Классификатор текстов на естественном языке.
-
http://www.philology.ru/linguistics1/kubryakova-01.htm
О тексте и критериях его определения
-
http://xpoint.ru/know-how/VebAlgoritmyi/RabotaSTekstami/RabotaSRusskoyMorfologieyPriPomoschiSlovaryaIspell
При работе с русскоязычными текстами часто возникает необходимость привести произвольное
слово к его исходной форме, либо найти все словоформы данного слова. Особенно часто
такая задача возникает при реализации поиска. Для её решения можно воспользоваться
словарём русского языка для программы ispell
-
http://www.workshare.com/products/wsdeltaview/
Официальная страница разработчиков программы сравнения документов.
-
http://www.stat.su/articles.php?id=18
Алгоритм эффективного способа обнаружения дубликатов web документов с использованием
инвертированного индекса
-
http://www.citforum.ru/SE/project/fuzzy_comp/
Нечеткое сравнение коллекций: семантический и алгоритмический аспекты
-
http://www.dialog-21.ru/dialog2007/materials/html/11.htm
Лексико-синтаксические шаблоны
в задачах автоматической обработки текста
-
http://www.rco.ru/product.asp?ob_no=12&part=
RCO for BackOffice позволяет осуществлять полнотекстовый поиск с учетом словоформ
русского языка в следующих приложениях Microsoft
-
http://vseslova.com.ua/
Сервис определяет смысл слова, показывает примеры использования.
Полезные и интересные материалы
-
http://community.livejournal.com/kubok/45852.html
Поиск через Яндекс для специалистов. Материал рассчитан на подготовленного читателя, знающего, что такое стоп-слова, сниппеты и чем '~~' отличается от '&&'.
-
http://www.google.com/help/basics.html
Нюансы запросов поисковой системы Google.
-
http://kubok.yandex.ru/test.html
Конкурс на умение пользоваться поисковой системой Яндекс.
-
http://help.yandex.ru/search/?id=481939
Яндекс обладает мощным языком запросов, позволяющим контролировать малейшие нюансы
его поведения при поиске. Для использования наиболее востребованных команд не обязательно
запоминать операторы — можно воспользоваться расширенным поиском.
|