Міністерство освіти І науки, молоді та спорту україни національний університет «львівська політехніка» інститут комп’ютерних наук та інформаційних технологій
Вид материала | Документы |
Додаток А Порядок виконання роботи Зміст звіту |
- Міністерство освіти І науки, молоді та спорту україни, 59.16kb.
- Національний університет «львівська політехніка» алзаб аєд хамдан, 385.08kb.
- Міністерство Освіти І Науки України Національний університет “Львівська політехніка”, 2021.84kb.
- Міністерство освіти І науки україни національний університет «львівська політехніка», 1068.44kb.
- Міністерство освіти І науки україни національний університет «львівська політехніка», 1259.1kb.
- Міністерство освіти І науки україни національний університет «львівська політехніка», 1080.17kb.
- Міністерство освіти І науки україни національний університет «львівська політехніка», 1563.62kb.
- Міністерство освіти І науки, молоді та спорту україни інститут інноваційних технологій, 182.18kb.
- Міністерство освіти І науки, молоді та спорту україни національний університет “львівська, 104.86kb.
- Міністерство освіти І науки, молоді та спорту україни івано-франківський національний, 85.61kb.
Додаток А
Сьогодні ми вивчили:
- Поняття функції та модуля.
- Основні лексичні ресурси NLTK та способи роботи з ними.
- Робота з словником WordNet.
Порядок виконання роботи
1. Ознайомитися з теоретичними відомостями.
2. Виконати приклади, які використовуються в теоретичних відомостях.
3. Виконати наступні вправи:
- Дослідити зв’язки голонім-меронім для іменників. Знайти іменники для демонстрації наступних зв’язків: member_meronyms(), part_meronyms(), substance_meronyms(), member_holonyms(), part_holonyms(), та substance_holonyms().
- Використовуючи компаративний словник знайти для німецької, італійської та англійської мов близькі слова. Чи можуть отримані результати використовуватися для здійснення перекладу?
- Побудувати умовний частотний розподіл для корпусу імен. Знайти які перші літери частіше використовуються в чоловічих та жіночих іменах.
- Здійснити аналіз словника вимов. Знайти скільки різних слів він містить. Який відсоток слів з цього словника можуть мати різну вимову?
- Який відсоток синсетів іменників не мають гіпонімів? До всіх синсетів можна доступитися за допомогою wn.all_synsets('n').
- Визначити функцію supergloss(s) , яка буде приймати синсет s як аргумент і повертати стрічку в якій будуть поєднані всі описи всіх значень синсету s та описи всіх гіпернімів та гіпонімів s.
- Модифікувати програму генерації випадкового тексту для виконання наступного: зберігати можливі наступні слова у списку та вибирати їх за допомогою random.choice() попередньо виконавши import random.
- Модифікувати програму генерації випадкового тексту для виконання наступного: тренувати програму на текстах різних жанрів та різних корпусів. Генерацію тексту провести з 5-ма різними початковими словами. Результати проаналізувати та порівняти.
- Модифікувати програму генерації випадкового тексту для виконання наступного: тренування програми на текстах двох різних жанрів та генерації тексту об’єднаного жанру.
- Полісемія - це явище коли одне слово має декілька значень ( іменник dog має 7 значень, кількість яких визначити можна як len(wn.synsets('dog', 'n'))). Знайдіть середнє значення полісемії для іменників.
- Полісемія - це явище коли одне слово має декілька значень ( іменник dog має 7 значень, кількість яких визначити можна як len(wn.synsets('dog', 'n'))). Знайдіть середнє значення полісемії для прикметників.
- Полісемія - це явище коли одне слово має декілька значень ( іменник dog має 7 значень, кількість яких визначити можна як len(wn.synsets('dog', 'n'))). Знайдіть середнє значення полісемії для дієслів.
- Полісемія - це явище коли одне слово має декілька значень ( іменник dog має 7 значень, кількість яких визначити можна як len(wn.synsets('dog', 'n'))). Знайдіть середнє значення полісемії для прислівників.
- Використовуючи один з методів визначення подібності слів побудуйте відсортований по спаданню список значень подібності для наступних пар слів: car-automobile, gem-jewel, journey-voyage, boy-lad, coast-shore, asylum-madhouse, magician-wizard, midday-noon, furnace-stove, food-fruit, bird-cock.
- Використовуючи один з методів визначення подібності слів побудуйте відсортований по спаданню список значень подібності для наступних пар слів: bird-crane, tool-implement, brother-monk, lad-brother, crane-implement, journey-car, monk-oracle, cemetery-woodland.
- Використовуючи один з методів визначення подібності слів побудуйте відсортований по спаданню список значень подібності для наступних пар слів: monk-oracle, cemetery-woodland, food-rooster, coast-hill, forest-graveyard, shore-woodland, monk-slave, coast-forest, lad-wizard, chord-smile, glass-magician, rooster-voyage, noon-string.
- Використовуючи один з методів визначення подібності слів побудуйте відсортований по спаданню список значень подібності для наступних пар слів: monk-oracle, cemetery-woodland, food-rooster, coast-hill, forest-graveyard, crane-implement, journey-car, coast-shore, asylum-madhouse, magician-wizard, midday-noon, furnace-stove, food-fruit, bird-cock.
4. Підготувати і оформити звіт.
Варіант | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
Номери завдань | 1 | 2 | 1 | 2 | 1 | 2 | 1 | 2 | 1 | 2 | 1 | 1 | 2 | 1 | 2 |
3 | 5 | 5 | 3 | 3 | 5 | 5 | 3 | 3 | 5 | 5 | 3 | 5 | 5 | 3 | |
4 | 6 | 4 | 6 | 6 | 4 | 4 | 4 | 6 | 4 | 6 | 6 | 4 | 4 | 4 | |
7 | 8 | 9 | 9 | 7 | 8 | 7 | 8 | 9 | 9 | 7 | 8 | | | | |
10 | 11 | 12 | 13 | 10 | 11 | 12 | 13 | 10 | 11 | 12 | 10 | 11 | 12 | 13 | |
14 | 15 | 16 | 17 | 14 | 15 | 16 | 17 | 14 | 15 | 16 | 14 | 15 | 16 | 17 | |
|
Варіант | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 |
Номери завдань | 1 | 2 | 1 | 2 | 2 | 1 | 2 | 1 | 2 | 1 | 2 | 1 | 2 | 1 | 2 |
3 | 5 | 5 | 3 | 5 | 5 | 3 | 3 | 5 | 5 | 3 | 3 | 5 | 5 | 3 | |
4 | 6 | 4 | 6 | 6 | 4 | 4 | 6 | 6 | 4 | 6 | 6 | 4 | 4 | 6 | |
7 | 8 | 9 | 9 | 7 | 8 | 7 | 8 | 9 | 9 | 7 | 8 | 8 | 7 | 9 | |
10 | 11 | 12 | 13 | 11 | 12 | 13 | 10 | 11 | 12 | 13 | 10 | 11 | 12 | 13 | |
14 | 15 | 16 | 17 | 15 | 16 | 17 | 14 | 15 | 16 | 17 | 14 | 15 | 16 | 17 | |
|
Зміст звіту
- Титульний аркуш.
- Мета роботи.
- Короткі теоретичні відомості.
- Тексти програм на мові Python.
- Висновок.
Література
- Steven Bird, Ewan Klein, Edward Loper Introduction to Natural Language Processing. 2001-2007 University of Pennsylvania.
- Г. Россум, Ф.Л.Дж. Дрейк, Д.С. Откидач, М. Задка, М. Левис, С.Монтаро, Э.С.Реймонд, А.М.Кучлинг, М.-А.Лембург, К.-П.Йи, Д.Ксиллаг, Х.ГПетрилли, Б.А.Варсав, Дж.К.Ахлстром, Дж.Рокинд, Н.Шеменон, С.Мулендер. Язык программирования Python./ 2001 – 452c.
- Сузи Р. А. Язык программирования Python.- 206с.
- David Mertz Text Processing in Python Addison WesleyBiber, 2003 - 544.
Інтернет посилання
Романюк Андрій Богданович, Юрчак Ірина Юріївна
МЕТОДИЧНІ ВКАЗІВКИ
до лабораторної роботи № 4
з дисципліни «Комп’ютерна лінгвістика»
для студентів спеціальності 7.02030303 «Прикладна лінгвістика»
денної та заочної форм навчання