Русский   English
ДонНТУ   Портал магістрів

Реферат за темою випускної роботи

Зміст

Вступ

У сучасному світі велику роль відіграє контроль знань учнів, студентів, працівників. Під контролем розуміється система науково обґрунтованої перевірки результатів навчання.

Існує безліч форм контролю — іспит, залік, атестація, контрольна. Але найбільш коректним засобом виміру знань на сьогоднішній день є тестування. Тестування — це сукупність спеціальним чином підготовлених і підібраних завдань, що дозволяє провести виявлення необхідних характеристик процесу навчання. Одне з головних переваг тестів полягає в тому, що вони дозволяють опитати всіх учасників з усіх питань потрібного матеріалу в однакових умовах, застосовуючи при цьому до всіх без винятку одну і ту ж, заздалегідь розроблену шкалу оцінок. Це значно підвищує об'єктивність і обґрунтованість оцінки в порівнянні з іншими формами контролю.

Тести та тестові завдання отримали своє поширення в сферах, де потрібно точно визначити знання з усього курсу навчання, де багато що здають, де потрібен ретельний відбір учасників: іспити в ДАІ, атестація працівників підприємств, прийом на роботу, атестація і контроль знань студентів, дистанційна освіта і екзаменаційний тест.

Сьогодні комп'ютерне тестування має низку переваг перед традиційним тестуванням. Воно відрізняється високою оперативністю, продуктивністю процесу тестування і об'єктивністю результатів контролю знань.

На відміну від бланкових систем тестування, комп'ютерні тести дозволяють використовувати складні методи контролю оцінки знань учнів, знизити фінансові та часові витрати при проведенні тестування, застосувати в тестах мультимедійні завдання, а так само підвищити відкритість процесу тестування.

Більшість систем тестування, не мають можливості відповідати на наші запитання. Коли ми хочемо щось дізнатися, ми запитуємо — задаємо питання, що, загалом, і природно в процесі пізнання. У зв'язку з цим взаємодія системи з користувачем через інтерфейс питання–відповідь набуває особливої актуальності і стає центральним завданням даного дослідження.

Система питання–відповідь — це інформаційна система, здатна приймати питання і відповідати на них на природній мові, іншими словами, це система з природно–мовним інтерфейсом. На вхід такій системі подається запит, сформульований на природній мові, після чого він обробляється з використанням методів NLP (Natural Language Processing), і генерується природно–мовна відповідь.

Як джерело інформації система питання–відповідь використовує локальне сховище, глобальну мережу, або і те й інше одночасно. Створення системи тестування на базі веб–технологій є вкрай перспективною і актуальною науковою задачею, результатом якої буде створення сучасної моделі веб–сервісу тестування знань з використанням інтерфейсу питання–відповідь і за допомогою засобів веб–розробки для ефективної роботи.

З моменту появи перших прототипів систем питання–відповідь їх область застосування значно розширилася. Наприклад, їх використовують у відповідях на питання, пов'язані з часом, геолокаційні питання, вивчаються так само суміжні області, такі як: побудова інтерактивних систем питання–відповідь, повторне використання відповідей і уявлення знань. Але область використання інтерфейсів питання–відповідь в системах тестування залишається не дослідженою, аналогів на даний момент немає, і це є доброю перспективою для розробки дослідницької бази для майбутніх робіт.

1. Актуальність теми

Передбачається, що дана магістерська робота дозволить розширити існуючі моделі питально–відповідної системи, збільшивши їх гнучкість і сприйнятливість в межах деякої предметної області.

На даний момент розроблені багато аспектів проблеми розвитку творчого мислення учнів у навчальному процесі. Доведено вплив самостійної постановки питань і складання задач на більш глибоке засвоєння навчального матеріалу, на розвиток самостійності. Всі ці аспекти безпосередньо пов'язані з використанням питань для організації навчально–пізнавальної діяльності учнів, проте, в центрі обговорення — використання питань або питально–відповідна методу.

Проблема дослідження — це як за допомогою питально–відповідна інтерфейсу системи тестування організувати навчально– пізнавальну діяльність учнів у процесі навчання так, щоб стимулювати інтелектуальний і творчий розвиток таких учнів? Важливою вимогою до освітньої системи на сучасному етапі є необхідність допомагати учням самим добувати знання, орієнтуватися в насиченому інформаційному просторі, тобто вчити їх працювати творчо, а не репродуктивно. Організувати процес навчання необхідно таким чином, щоб учень сам задавав питання системі для поповнення необхідних знань. Організація навчального процесу, при якому учень є ініціатором навчального діалогічного спілкування з системою, дозволяє по–новому виявити роль і функції системи, яка вже виступатиме як помічник учня, і її роль полягає, насамперед, у координуванні діалогу.

2. Мета і задачі дослідження та заплановані результати

Мета дослідження: вирішити виявлену проблему шляхом наукового обгрунтування та розробки методики використання питально–відповідна інтерфейсу як інструменту ведення “зворотного діалогу” з системою, для інтелектуального і творчого розвитку учнів.

Об'єктом дослідження є процес навчання та перевірки знань учнів за допомогою системи тестування з інтерфейсом питання–відповідь.

Предметом дослідження є метод використання інтерфейсу питання–відповідь в системах тестування, стимулюючих інтелектуальний і творчий розвиток учнів.

При вирішенні поставленої проблеми за основу бралися гіпотези про те, що організація навчально–пізнавальної діяльності учнів у процесі навчання за допомогою питально–відповідна інтерфейсу стимулюватиме їх інтелектуальний і творчий розвиток, якщо:

  • змістити акцент з контролюючої функції системи тестування з інтерфейсом питання–відповідь на розвиваючу;
  • враховувати і спиратися на психолого–педагогічні особливості учнів;
  • організувати спеціальне навчання поетапного виконання двох елементарних процедур: постановка питання і формулювання відповіді, а потім їх самостійного послідовному та взаємопов'язаному здійсненню ;
  • вибір і використання інтерфейсу питання–відповідь для здійснення діалогового взаємодії учасників педагогічного процесу.

Для реалізації поставленої мети необхідно вирішити наступні завдання дослідження:

  • виявити й узагальнити досвід дослідження даної проблеми в теорії та практиці, недоліки та переваги;
  • встановити і перевірити в педагогічній практиці умови ефективності використання питально–відповідних процедур як засобу інтелектуального і творчого розвитку учнів;
  • визначити модель і структуру інтерфейсу питання–відповідь системи тестування для ефективної реалізації процедури зворотного діалогу;
  • перевірити ефективність розробленої методики використання інтерфейсу питання–відповідь в процесі навчання, для підвищення якості самоосвіти учнів.

Призначенням системи є навчання учнів за допомогою питально-відповідна інтерфейсу і процедури зворотного діалогу, а так само точне оцінювання знань користувача проходить тестування на основі адаптивного комплексного тестування з обраної предметної області.

3. Огляд досліджень та розробок

Автори більшості створюваних в даний час систем питання–відповідь природним чином орієнтуються на англійську мову. Однак будь–яка серйозна система повинна будь–яким чином аналізувати структуру запиту, опираючись на знання про мову, на якому він сформульований. Тому призвести об'єктивне порівняння систем, розрахованих на різні мови, практично неможливо. Тим не менш, можна вивчити принципи роботи будь даної системи і зробити висновок про глибину виробленого їй аналізу пропозицій запиту і вхідного тексту.

Насамперед, слід зазначити, що для англійської мови вже існують вільно поширювані у вихідних текстах синтаксичні аналізатори (наприклад CMU Link Parser) і довідкові системи за словами мови, найпопулярніша з яких — WordNet. Система CMU Link Parser, розроблена в університеті Карнегі–Меллона, будує для будь–якого заданого пропозиції його синтаксичну структуру, що складається з помічених зв'язків, що з'єднують пари слів. Вбудований словник аналізатора складається з приблизно 60 000 словоформ, крім того, система здатна працювати з невідомими словами, роблячи здогади про їх приналежності до тих чи інших частин мови. Проект WordNet — це потужний тлумачний словник і тезаурус, що видає результати своєї роботи в зручному для комп'ютерного аналізу структурованому вигляді. Самі словникові статті при цьому, однак, є саме словарними статтями в класичному сенсі, тобто вони представляють собою тексти англійською мовою, взагалі кажучи призначені для читання людиною. Безумовно, WordNet є дуже корисним інструментом і в даний час ведеться адаптація для російської мови.

Системи WordNet і CMU Link Parser використовуються в питально–відповідної системі, спільно з пошуковою машиною загального призначення Managing Gigabytes. Спочатку користувальницький запит обробляється синтаксичним аналізатором CMU Link Parser, потім за допомогою нескладного алгоритму в ньому вибирається сутність, тобто власне елемент, який підлягає пошуку в колекції вхідних документів. Наступний етап — визначення типу відповіді за допомогою аналізу запитуваної сутності системою WordNet. Потім кожному іменнику з набору вхідних документів приписується його атрибут. На кінцевому етапі отримана інформація надходить на вхід пошукової машини, яка і здійснює вибір релевантних фраз.

Однією з найбільш розвинених в даний час питально–відповідних систем є розроблена в Далласі система Lasso. Для індексації елементів використовується узагальнена пошукова система. Введений запит аналізується, визначається його тип, запитувану сутність і тип відповіді. Алгоритм визначення наведених елементів ґрунтується на послідовному застосуванні восьми різних евристик. Для знаходження відповіді система переглядає документи в пошуках входження цікавлять типів сутностей. Типи сутностей для слів із вхідних документів визначаються за допомогою лексико–семантичного аналізатора, заснованого на словниках Gazetteer і WordNet. Знайдені відповіді ранжуються за релевантністю за допомогою спеціальної оцінної функції, що включає в себе кількість знайдених слів, пунктуаційні характеристики, “цілісність” пропозиції і деякі інші елементи.

Проаналізувавши аналоги, можна зробити висновок, що системи високого рівня для російської мови в даний час знаходяться тільки в стадії розробки. З іншого боку, є об'єктивні передумови для створення систем питання–відповідь, за якістю не поступаються західним аналогам [1].

3.1 Огляд міжнародних джерел

Система питання–відповідь являє собою програмний модуль, що дозволяє людині вести з машиною діалог на природній мові. Користувач задає питання програмній системі, а програмна система друкує відповіді, що формуються у вигляді осмислених пропозицій. Перші системи питання–відповідь з'явилися в 60–х роках минулого століття. серед найбільш відомих реалізацій слід виділити системи BASEBALL LUNAR. Система BASEBALL дозволяла вести діалог з користувачем, які цікавляться результатами змагань бейсбольної ліги США за минулий рік. Система LUNAR відповідала на питання, пов'язані з геологічним аналізом зразків порід, доставлених з місячної поверхні експедиціями програми “Аполлон”. Обидві системи були досить ефективно реалізовані і представляли собою приклади систем питання–відповідь, орієнтованих на конкретну предметну область. Наприклад, система LUNAR, демонструвалася на конференції 1971 р., на якій обговорювалися питання місячних досліджень, дозволяла отримати відповіді приблизно на 90 % усіх питань, заданих даній системі. Деякі відомі програмні системи, розроблені в 60–х роках минулого століття, містили в собі питально–відповідні модулі у вигляді підсистем.

Так, програма ELIZA 1 містила в якості програмного модуля питально–відповідну систему, яка, власне, і дозволяла спілкуватися з користувачем. У 70–х і 80–х роках минулого століття було реалізовано досить багато систем питання–відповідь, що дозволяють вести діалог з користувачем у конкретній предметній області. Наприклад, програмний комплекс Unix Consultant відповідав на питання, пов'язані з операційною системою UNIX. Unix Consultant був заснований на досить складною і розвиненою базі знань, що містить інформацію про операційну систему UNIX. Інтерфейс до бази знань був реалізований у вигляді системи питання–відповідь[2].

До сучасних навчальним систем відносяться системи TrainingWare, eLearning Server 3000 v2.0, eLearningOffice 3000, IBM Workplace Collaborative Learning і HyperMethod 3.5 компанії ГіперМетод, яка є найбільшим російським розробником готових рішень і програмного забезпечення в області мультимедіа, експертного навчання та електронної комерції [3].

3.3 Огляд локальних джерел

Створення систем тестування знань не є інноваційною ідеєю, так як раннє успішно розроблялися і створювалися системи такого типу, як в Україні так і за її межами. У Донецькому національному технічному університеті проводяться дослідження за темами, суміжним з моєю. Статті Звенигородського А.С. (кафедра систем штучного інтелекту) присвячені дослідженням і вирішенню багатьох проблем у цій сфері. Наприклад, у статті Звенигородський А.С., Іванова С.Б., Чернишова В.М. “Модель однієї відповіді на запитання в природно-мовних системах тестування” розглядається проблема моделювання питань на перерахування в системах комп'ютерного тестування знань. Запропоновано модель відповіді на перерахування, що враховує складові предметної області відповіді і природно мовні засоби їх вираження. Представлено алгоритм аналізу та оцінки відповіді на перерахування. А в статті Звенигородський А.С., Чернишова В.М. “Модель питання в природно-мовних системах тестування” розглядається проблема генерування питань у системах комп'ютерного тестування знань. Запропоновано модель питання, що враховує складові предметної області питання і поточні параметри тестування. Представлена структурна схема процесу формування питання [ 4 ].

У Харківському національному університеті радіоелектроніки створений тестовий центр з метою розробки та впровадження технологій комп'ютерного тестування знань. Під керівництвом к.т.н., доцента кафедри автоматизації проектування обчислювальної техніки Олександра Сергійовича Шкіля розроблена і успішно впроваджена система OpenTEST2 - це комп'ютерна програма тестування знань створена для очного підсумкового контролю якості знань учнів у великих навчальних організаціях зі складною розподіленою структурою.

На сьогоднішній день існує достатня кількість стандартних систем тестування знань. Дослідження показують, що більша частина з них орієнтована на проходження тестування в Internet через Web-інтерфейс. Програми українського виробництва, на жаль, поки не можуть скласти гідну конкуренцію зарубіжним аналогам. Проте інтерес до комп'ютеризації освіти в нашій країні стрімітельно зростає. І можливо, в найближчому майбутньому, з'явиться гідний програмний продук, який займе своє місце на ринку IT-розробок.

Зокрема, роботи наших магістрів, у яких були успішно створені готові програмні продукти, і які успішно пройшли тестування:

  • Магістр Трофименко Є.С. “Розробка автоматизованої системи тестування знань студентів у галузі комп'ютерних технологій з використанням механізмів адаптації”
  • Магістр Буланов М. А. “Дослідження та особливості реалізації сучасних інтерактивних систем контролю знань студентів”
  • Магістр Бесіда А.Б. “Розробка і забезпечення ефективного функціонування мережної системи тестування знань”
  • Магістр Кушнарьов А. В. “Семантичні моделі природно-мовних методів у системах тестування”
  • Магістр Чанглі А. Н. “Структура і організація WEB-сервісів тестування знань на базі інфраструктури Інтернет”

4. Методи реалізації системи тестування з інтерфейсом питання–відповідь

4.1 Загальна модель представлення системи

При створенні моделі системи тестування з інтерфейсом питання–відповідь, було вивчено велику кількість робіт з даної теми, серед яких можна виділити ряд спільних недоліків:

  • використання однієї методики складання тесту, що звужує можливості тестування;
  • негнучкість процедур розрахунку підсумкової оцінки, внаслідок застосування методів, що використовують алгоритм накопичення балів, методів ранжирування, методів заохочення і штрафів;
  • висока трудомісткість формування високоефективних тестів, або зведення процедури формування тесту до випадкового вибору питань;
  • використання заздалегідь сформованих тестів, що виключає можливість використання адаптивних методик тестування або робить їх недостатньо гнучкими [5].

Сучасні системи питання–відповідь працюють з необмеженими або обмеженими предметними областями. У першому випадку вони більше нагадують традиційні пошукові системи, проте відрізняються від них тим, що використовують більшу кількість онтологій.

Основним додатком системи тестування з інтерфейсом питання–відповідь є реалізація інтерфейсу людина–база знань для різних областей застосування. Крім того, системи питання-відповідь, вирішують завдання інформаційного пошуку взагалі.

Перелічимо основні вимоги для виведення відповіді користувачу:

  • відповідь має бути лаконічною (короткою);
  • відповіді на питання може і не бути в використовуваної колекції, система повинна особливим чином розпізнавати цю ситуацію і оповіщати користувача;
  • відповідь може виводитися з декількох джерел (документів);
  • відповідь має бути актуальним (сучасним, свіжим).
  • різні джерела можуть містити суперечливі відповіді, система повинна вибирати більш авторитетне джерело (блоги та новини);
  • відповідь має нести нову інформацію для користувача;
  • система може використовувати діалог з користувачем для уточнення інформаційних потреб [6].

4.2 Системи питання–відповідь, що базуються на веб–пошуку

Системи питання–відповідь, що базуються на веб–пошуку, як джерело використовують веб–сторінки або їх фрагменти. При побудові даних систем використовується результати систем інформаційного пошуку мережі Інтернет, тобто в даному випадку в архітектуру включена одна з існуючих пошукових систем. Системи питання–відповідь, отримуючи питальне речення на природній мові від користувача, обробляє його, генерує запит з ключових слів для пошукової системи. Ключові слова вибираються виходячи з самого питального пропозиції. Після пошукового запиту система отримує результати інформаційного пошуку у вигляді веб-посилань і фрагментів тексту–сніпетів. Сніппет — невеликий уривок тексту з веб-документа результатів роботи пошукової системи, який використовується в якості опису посилання результатах пошуку. Зазвичай сниппет містить контекст, в якому зустрілося ключове слово в тексті веб–документа.

Далі система питання–відповідь працює з даними фрагментами веб-документів, використовуючи методи обробки природних мов, генерує відповідь користувачеві. Зазвичай це методи виділення різних іменованих сутностей, дат, чисел і різні алгоритми вибору фрагмента тексту в якості відповіді.

Відзначимо основні переваги даних систем:

  • немає необхідності зберігання та індексування великої кількості текстової інформації;
  • використання сторонніх компонентів у вигляді пошукової системи звільняє від вирішення завдань розробки пошуку релевантних документів.

Але є й недоліки даного підходу до розробки систем питання-відповідь:

  • якість інформації залежить від результатів роботи обраної пошукової системи, але в даний час популярні пошукові системи видають досить точні і релевантні результати;
  • розмір одержуваних сніпетів залежить від обраної пошукової системи і не може бути змінений;
  • текстова інформація в сніппета неструктурована [8].

4.3 Основні методи пошуку відповіді

Після того, як визначені ключові слова, тобто, сформульовано питання користувача, робота системи переходить на наступний етап — етап інформаційного пошуку.

Інформаційний пошук

На даному етапі відбувається отримання релевантних пошуковому запиту текстових фрагментів, які можливо містять відповідь. У сучасних питально–відповідних системах даний модуль являє собою класичну пошукову машину, на вхід якої надходить запит з ключових слів. Після того як отримано набір текстових документів, релевантних запиту, витягуються фрагменти, в яких велика ймовірність отримання відповіді на запитання. Для того щоб отримати фрагменти з документів, які можуть одержати відповідь з найбільшою ймовірністю, текст документа ділиться на частини — одним зі способів є поділ на абзаци. Потім вибирається той фрагмент (абзац), який здобуде всі ключові слова або найбільша їх кількість. Нехай є пошуковий запит, що складається з наступного набору ключових слів: {k1, k2, k3, k4}. Текст документа розділений на фрагменти (параграфи) і один з параграфів містить включення k1, k2, k3, причому k1 і k2 зустрічаються два рази, k3 — один. Вводиться поняття вікна параграфа воно включає в себе весь текст між двома ключовими словами-одним, розташованим вище інших по тексту, другий — нижче. Розглядаються всілякі включення ключових слів у фрагмент документа (вікно параграфа). Таким чином, для даного випадку можна отримати 4 випадки вікна параграфа:[K1-1, k2-1, k3], [k1-2, k2-1, k3], [k1-1, k2-2, k3], [k1-2, k2-2, к3]. Кожне з вікон параграфів оцінюється для кожного з них розраховуються такі величини:

  • Same_word_sequence_score — кількість слів з опитування, що зустрічаються у вікні параграфа в такому ж порядку;
  • Distance_score — кількість слів, що розділяє самі віддалені ключові слова у вікні параграфа;
  • Missing_score — кількість слів із запиту, не зустрічаються у вікні параграфа.

Далі відбувається сортування і вибір фрагмента документа, причому порівнюються величини всіх вікон усіх параграфів [9].

Витяг відповіді

На даному кроці розпізнається і витягується з отриманих текстових фрагментів відповідь на запитання. Важливу роль у виділенні відповіді відіграє тип відповіді. Загальна ідея вирішення завдання вилучення відповідей полягає в наступному: виявляються так звані кандидати для відповіді — слова або словосполучення, які можуть розглядатися як відповідь на запитання. Потім проводиться аналіз списку кандидатів, всі кандидати оцінюються, вибирається найбільш підходящий, тобто той, який має найвищу оцінку.

Вибір кандидатів відповідей

Виділення іменованих сутностей. Стратегія вилучення відповіді з текстового фрагмента залежить від типу очікуваної відповіді. Найчастіше для фактографічних питань при первинному аналізі фрагментів тексту використовуються методи виділення іменованих сутностей. Наприклад, для таких типів відповіді, як географічні розташування, імена людей (PERSON, LOCATION, COUNTRY) у витягу відповіді будуть використані алгоритми розпізнавання імен власних. Для вилучення сутностей може використовуватися готова стороння система вилучення інформації, яка навчається розміченим текстовим корпусом, також може використовуватися словники, що містять списки різних сутностей.

Використання шаблонів. Розглянемо один з популярних способів вилучення відповіді — за допомогою відповідності шаблонах. Для кожного типу відповіді складаються шаблони, за допомогою них в текстових фрагментах проводиться пошук і виділення кандидата відповіді. Для вибору відповіді використовуються інформація про тип очікуваної відповіді, отримана на першому етапі роботи системи, і символьні шаблони.

Шаблони можна створювати як вручну, так і автоматичними навченими алгоритмами. Також можна використовувати автоматичні методи для виявлення шаблони для подальшого їх застосування. Метою навчання є виявлення та побудова зв'язків між конкретним типом відповіді (наприклад, DATE_OF_DEATH) і конкретним фокусом питання (для цього випадку — персона). Таким чином, потрібно виявити шаблони, що зв'язують два види цих фраз (PERSON / DATE_OF_DEATH). Наведемо приблизний алгоритм навчання для виявлення шаблонів:

  • для створення зв'язку між двома сутностями створюється список з правильних пар;
  • виробляється запит пошуковій машині з частин цих пар;
  • далі вибираються пропозиції з релевантних документів, що містять обидві частини пар;
  • витягується шаблон, що містить слова та знаки пунктуації між цими частинами пар;
  • далі оцінюються і вибираються шаблони.

Використання N–грам. Іншим способом вилучення відповідей з фрагментів є виявлення кандидатів застосуванням n–грам. N–грами — це під послідовність з n елементів, наступних один за одним в даній послідовності. Даний алгоритм ефективно застосовувати до сніпетів при пошуковому запиті, отриманому при перефразовуванні питального речення. На першому етапі з сниппета витягуються уніграмми, біграми і триграми. Далі їм присвоюються ваги, рівні кількості сніпетів, в яких зустрілася дана n–грами. Наступний етап — оцінювання та збір кандидатів з n-грам. При оцінюванні переслідується мета визначення того, наскільки дана n-грами відповідає типу очікуваної відповіді. Далі n–грами ранжуються, вибирається певну їх кількість з високими оцінками і будується кандидат відповіді, шляхом конкатенації n–грам. Кандидат для відповіді з високою оцінкою вибирається в якості відповіді.

Оцінка кандидатів відповіді

Після вибору кандидатів проводиться оцінка і вибір потенційного відповіді. Оцінка проводиться за допомогою перевірки різними способами. Для кожного типу відповіді складаються шаблони, за допомогою них в текстових фрагментах проводиться пошук і виділення кандидата відповіді. Є багато різних підходів, застосовуваних для вирішення завдання вибору відповіді з кандидатів, в цілому вони все відрізняються тим, як формалізуються, порівнюються і обробляються в них пропозиції на природній мові для оцінки і виділення потенційних відповідей серед кандидатів відповіді.

Метод мішка слів. Один з простих способів обчислення оцінки для кандидата відповіді є метрика методу мішка слів:

Метод мешка слов

Рисунок 3 — Метод мішка слів.

де Qk — безліч слів питання, Ak — безліч слів сніппета, що містить кандидата відповіді, а оцінка Sk для k–го кандидата обчислюється, як відношення потужності перетину множин Qk і Sk і потужності множини Qk [1014].

Метод з використанням семантичних структур

Для оцінки кандидата відповіді можна використовувати обробку текстової інформації, пов'язаної з розміткою семантичних ролей. Загальна формулювання завдання розмітки семантичних ролей полягає в наступному: для пропозиції на природній мові необхідно визначити безліч учасників ситуації, описуваної в цьому реченні, і їх семантичні ролі — відповідні відносини між учасниками. У результаті створюється семантична структура — структуроване уявлення текстової інформації, що представляється у вигляді орієнтованого графа, яке використовується для оцінки кандидата відповіді. Для цього порівнюються граф питального пропозиції та граф пропозиції, в якому міститься кандидат відповіді. І по обчисленої міру схожості графів можна проставити оцінку кандидату відповіді.

На рисунку 4 представлений приклад розбору пропозиції “Кеннеди убил его личный водитель из специального оружия взрывными пулями в упор”, у вигляді семантичного графа.

Семантический граф предложения

Рисунок 4 — Семантичний граф пропозиції

Для російської мови з доступних рішень, які можна використовувати для оцінки кандидата відповіді на питання, є технологія семантичного аналізу системи АОТ. Семантичний аналіз пропозиції увазі процес виявлення його семантичної структури. Введемо термінологію, певну авторами системи АОТ і аналогічну використовуваної в задачі розмітки семантичної ролей. Семантична структура складається з семантичних вузлів (учасників ситуації) і семантичних відносин (семантичних ролей). Після аналізу пропозиції виходить безліч з вузлів і відносин між ними. Вузлами є слова або словосполучення з пропозиції, а відносини являють собою зв'язки з мітками, які позначають різні типи семантичних ролей. У результаті отримане безліч можна візуалізувати у вигляді орієнтованого дерева-графа, який автори системи називають семантичним графом пропозиції [1516].

Висновки

Підвищення цінності освіти в суспільстві і розвиток обчислювальної техніки інформаційних технологій визначили широке поширення навчальних систем і систем перевірки знань.

Дані дослідження мають підвищити якість оцінювання знань, формалізувати й автоматизувати методику формування адаптивних тестів, оцінити якість формованих системою тестів, надати можливість оцінювання знань як, загалом, з дисципліни, так і з окремих тем зокрема.

Більшість дослідницьких питально–відповідних систем побудовано за типовим конвеєру. Розрізняють етап аналізу питання, на якому важливо визначення типу очікуваної відповіді, етап інформаційного пошуку, на якому отримують текстові фрагменти, і етап витягання відповіді, на якому проводиться пошук і вибір кандидатів відповіді, їх оцінка та вибір потенційного відповіді. Велика частина сучасних питально–відповідних систем використовуються різні методи аналізу і обробки природних мов. На основі дослідження існуючих рішень можна зробити висновок про можливість реалізації прототипу питально-відповідна інтерфейсу для системи тестування, заснованого на веб–пошуку з використанням методів обробки природної мови, так як при цьому немає необхідності в підтримці великої бази текстових документів, відсутня необхідність в залученні експертів , не потрібна розробка методів пошуку текстових фрагментів, що містять потенційний відповідь і можна абстрагуватися від завдань інформаційного пошуку.

Був проведений аналіз існуючих засобів семантичного розбору природно-мовних текстів, їх особливості та технології. Описано алгоритми системи аналізу тексту і розроблена структура системи побудови семантичного розбору для природно–мовних текстів.

Важливе зауваження

При написанні даного автореферату магістерська робота ще не завершена. Імовірна дата завершення – 10 грудня 2015. Повний текст роботи, а також матеріали по темі можуть бути отримані у автора або його керівника після зазначеної дати.

Перелік посилань

  1. Лапшин В.А. Вопросно-ответные системы: развитие и перспективы /В.А. Лапшин.—М.: 2012–32 с.
  2. Никитин А.,Райков П. Вопросно-ответные системы [Электронный ресурс]. — URL: http://yury.name/internet/06ia-seminar.ppt
  3. Нурбекова Ж.К., Даутова А.З., Кашкинбаева Д.Б. Технология проектирования мультимедийных обучающих систем/ К.Ж. Нурбеков, А.З. Даутова, Д.Б. Кашкинбаева — Павлодар,2003–108 с.
  4. Звенигородский А.С., Иванова С.Б., Чернышова В.Н. Модель одного ответа на вопрос в естественно-языковых системах тестирования/ А.С. Звенигородский, С.Б. Иванова, В.Н. Чернышова — "Искусственный интеллект — 2’2012"
  5. Корхов А.В. Метод построения вопросно-ответной системы с использованием математической формализации русского языка/ А.В.Корхов — СПбГУ.СПб.: 2001–120 c.
  6. Логунова О.С. Человеко-машинное взаимодействие: теория и практика: Учебное пособие / О.С. Логунова — Ростов н/Д: Феникс, 2006–206c.
  7. Болотова Л.C. Системы искусственного интеллекта./Л.C. Болотова М.: 1998–156с.
  8. Поспелов Г.С. Искусственный интеллект — основа новой информационной технологии / Г.С. Поспелов — М.: Наука, 1988. – 279 с.
  9. Гаврилова Т.А. Базы знаний интеллектуальных систем / Т.А. Гаврилова — СПб.: Питер, 2001. – 384 с.
  10. Лукьяненко С.А., Бессонов А.В., Казакова Е.И. Моделирование семантики естественно языковых высказываний в автоматизированных информационных системах [Электронный ресурс]. — Режим доступа: http://masters.donntu.ru/2006/fema/lukyanenko/library/art03.htm
  11. Соловьёв А.А., Пескова О.В. Построение вопросно-ответной системы для русского языка: модуль анализа вопросов /А.А.Соловьёв, О.В.Пескова — М.: 2010.– с.41-49.
  12. Соснин П.И. Проблемно-ориентированные диалоговые среды/ П.И.Соснин — Саратов: СГУ, 1995. – 100 с.
  13. Соловьёв А.А. Кто виноват и где собака зарыта? Метод валидации ответов на основе неточного сравнения семантических графов в вопросно-ответной системе / А.А.Соловьёв —Труды РОМИП 2010– 56c.
  14. Соснин П. И. Вопросно-ответное программирование человеко-компьютерной деятельности / П. И. Соснин — Ульяновск : УлГТУ, 2010 – 240 с.
  15. Белов, Е.А. Разработка автоматизированной тестирующей системы с ответами испытуемого на естественном языке / Е.А. Белов — Материалы II Междунар.науч.–практ.конф. — Брянск: БГТУ; СГА, 2006. — С. 242–245.
  16. Гладун В. Структурирование онтологии ассоциаций для конспектирования естественно–языковых текстов / В. Гладун/ International Book Series, Number 2. Advanced Research in Artificial Intelligence. Supplement to the International Journal “Information Technologies & Knowledge” Volume 2 / 2008. — ITHEA, Sofia, 2008. – 153 c.