Wei-Cheng Lai, Edward Chang, and Kwang-Ting (Tim) Cheng - АНАТОМИЯ КРУПНОМАСШТАБНОГО ПОИСКА ИЗОБРАЖЕНИЙ

Wei-Cheng Lai, Edward Chang, and Kwang-Ting (Tim) Cheng
Morpho Software Inc.
3944 State Street, Suite #340
Santa Barbara, CA 93105
{wlai,echang,timcheng}@morphosoft.com

World-Wide Web стремительно движется от текстового содержания, ориентированного на мультимедийное содержание, и требует более персонализированным доступ, по нашему мнению. В данной статье мы представляем важнейших компонент для обеспечения эффективного поиска в веб-интерфейсе или в крупномасштабной графической библиотеке. В частности, мы предлагаем восприятие ориентированное на поиск компонентов, которые могут учиться пользователей. Благодаря примеру, мы продемонстрируем, каким образом и как объяснить, почему наше восприятие ориентированное на поиск парадигмы может эффективно персонализировать запрос и достигнуть высоких отметок.

В данном примере мы сравниваем ключевых слов на основе системы поиска изображений с нашим восприятием, предлагаемых на основе системы поиска изображений. Мы используем Yahoo! Картинная галерея (т. е. http://gallery.yahoo.com) в качестве испытательного полигона для ключевых слов на основе графического поиска. Предположим, пользователь хочет получить изображения, связанные с названием "райские птицы". Учитывая ключевые слова "райские птицы" галерея выдает пять изображений этого цветка.
Тем не менее, существуют более чем пять образов, имеющих отношение к "райские птицы" в Yahoo. Наша система может извлекать из них более соответствующие изображениями. Во-первых, наш запрос ключевых слов на основе поисковой системы с использованием "птица" и "цветы" хранить образы (обе птицы и цветы) в локальной базе данных. Во-вторых, мы используем наше восприятие на базе поисковой системы с локальной базой данных.

• Экран 1. Отбор проб и значение обратной связи. Экран разделен на две рамки по горизонтали. В левой части экрана обучающая рамка, на правой стороне имеется подобная рамка. Через обучающую рамку, система узнает, что пользователь хочет через процесс активного обучения. Схожесть поиск кадра показывает картинки, которые соответствуют запросу пользователя концепции. Система представляет количество образцов в обучающей рамке, и пользовательские знаки изображений, которые имеют отношение к его или к запросе концепции, нажав на соответствующие изображения. Один образ выбран в качестве значимых и остальной немаркированных изображения считаются неуместными. Пользователь указывает конец его или ее выбор, нажав на кнопку "Отправить" в обучающем экране. Это действие вызывает следующий экран.

• Экран 2. Отбор проб и значение обратной связи продолжается. Во-первых, сходство поиск кадра показывает, что система думает будут соответствовать запросам пользователей концепции на этот раз. как цифра указывает, одиннадцать найденых образов соответствуют концепции "райские птицы". Пользовательского запроса концепции был захвачен, хотя и несколько нечеткий. Пользователь может задать систему доработать концепцию целевой, выбрав соответствующие изображения в обучающем кадра. В этом примере, девять изображений (четыре картинки из первой строки, первая и третья картинки из второго ряда, третий образ из третьего ряда, и первые две фотографии из последнего ряда) имеют отношение к концепции. После того как пользователь нажмет на кнопку "Отправить" в кадр обучения, третий экран.

• Экран 3. Отбор проб и значение обратной связи заканчивается. Как отмечалось в двух итераций, наша система не в состоянии получить пятнадцать соответствующие изображения из графических данных. В этом примере мы используем, ориентированного на ключевые слова поиска, нашего восприятие на базе поисковой системы. Ориентированные на ключевые слова, поисковая система может быть использована для быстрого определения набора изображений, имеющих отношение к ключевым словам. Основываясь на этих соответствующих образов, поисковые системы могут изучить возможность помещения и открыть несколько изображений, имеющих отношение к пользовательскому запросу концепции. Имейте в виду, что наше восприятие на базе поисковой системы будет также работать без отборов из ключевых слов на основе поисковой системы.
Выше пример показывает, что восприятие ориентированного на поиск парадигмы достигает гораздо выше, потому что избегаются следующие ограничения, что традиционные ключевые слова-поиска парадигмы встречают:

1. Субъективные аннотации. Как мы видим из примеров, "райские птицы" изображение может быть аннотированную как "птица", "цветок", "Гавайи," и многие другие возможные слова. С одним из слов, чтобы проводить поиск ключевых слов не может получать изображения как в других словах.
2. Краткую аннотацию. Аннотацию изображения, как правило, не имеют, как много слов, что и в тексте документа. Ключевые слова, аннотации зачастую не могут точно и полностью захватить изображения семантики.
3. Незавершенный запрос-концепция разработки. Картинка стоит больше, чем тысяча слов. Таким образом, запрос несколько ключевых слов "вряд ли может характеризовать полный запрос концепции.
2 Архитектура системы
Мы представляем компоненты системы, которые делают восприятие изображения на основе поиска работы: многопартийной резолюции особенности экстрактор, восприятия на основе поисковой системы и высокого размерного индексатора.
2,1 Множественная резолюции свойства Экстрактор
Свойство экстрактор извлекает из особенностей восприятия изображения. Общие особенности восприятия имеют цвет, форму, текстуру, и пространственное расположение этих элементов. Векторизация может осуществляться в режиме оффлайн, однако, поскольку количество изображений может быть большим, векторизация должно бытьэффективной и действенной.
2,2 восприятия, ориентированное в поисковых системах
Восприятия на основе поисковой системы является сердцем образа персонального поиска. Механизм узнает пользователей запрос понятия, как обучение бинарного классификатора, который отделяет изображения, имеющих отношение к концепции запроса. Обучение проводится в итеративный процесс: Эта система представляет примеры для пользователей, для уточнения класса границы. Окончательный класса границы на основе опыта пользователей - актуальность обратной связи.
Актуальность обратной связи не является новой. К сожалению, традиционные методы обратной связи актуальности требуют большого количества учебных случаев, и поэтому это нецелесообразно. В нашем восприятии на базе механизма, мы изучаем активный обучения алгоритм, которым могут "воспользоваться" пользователи. Мы недавно предложил два активного обучения алгоритмов, MEGA (The Максимальное Ожидаемые Обобщение алгоритм) и SMMacHvh (Поддержка Вектор Machine активного обучения), для решения проблемы эффективно. Обратимся к этим публикациям в деталях.
2.3 Высокомерный Индексатор
Изображение часто характеризуются большим числом особенностей (более ста). Запрос концепция может быть наилучшим образом характеризовать отдельное подмножество функций. Чтобы справиться с проблемой "размерности" и для поддержки динамичного подпространство поиск, мы предлагаем схему индексации с использованием кластеризации и классификации методов для поддержки приблизительное сходство поисков. Наш метод статистического подхода индексации, который работает в два этапа. Он исполняет первый, не под надзором кластеризации с использованием дерева структурированного вектора квантования (TSVQ) для группы аналогичных объектов одновременно. Для достижения максимальной эффективности, каждой группе хранится в последовательном файле. Поиск подобия затем рассматриваются как проблемы классификации. Наша гипотеза заключается в том, что если запрос объекта класса прогнозирования С вероятных классов, то вероятность высока, что ее ближайшие соседи, можно найти в этих С классов. Эта гипотеза является аналогом ищет книги в библиотеке. Если мы ищем книги исчисления и мы знаем, исчисление относится к категории математике, посетив раздел математики мы можем найти много исчисление книг. Кроме того, при помощи поиска наиболее вероятных групп, на которые объект запроса могут быть классифицированы.
3 Заключение
В настоящем документе предлагается образ поисковую систему, которая использует активного обучения сложный и субъективный вопрос концепции. Мы представили ключевые компоненты-поддержки нескольких графических резолюции особенность-экстрактор и высокой размерной индексатор за оба запроса-концепция обучения и эффективного поиска изображений.

[1] E. Chang, K.-T. Cheng, W.-C. Lai, C.-T. Wu, C.-W. Chang, and Y.-L. Wu.   PBIR — a system that learns subjective image query concepts.   Proceedings of ACM Multimedia, http://www.mmdb.ece.ucsb.edu/~demo/corelacm/, pages 611-614, • October 2001.
[2] E. Chang and B. Li.   Mega — the maximizing expected generalization algorithm for learning complex query concepts (extended version). Technical Report http://www-db.stanford.edu/~echang/mega-extended.pdf, November 2000.
[3] A. Gersho and R. Gray. Vector Quantization and Signal Compression. Kluwer Academic, 1991.
[4] B. Li, E. Chang, and C.-S. Li. Learning image query concepts via intelligent sampling. Proceedings of IEEE Multimedia and Expo, August 2001.
[5] Y. Rui, T. S. Huang, and S.-F. Chang. Image retrieval: Current techniques, promising directions and open issues. Journal of Visual Communication and Image Representation, March 1999.
[6] S. Tong and E. Chang.   Support vector machine active learning for image retrieval.   Proceedings of ACM International Conference on Multimedia, pages 107-1 18, October 2001.