ПЛАН

1. Системи обробки зображень. Графічні редактори. Призначення. Основні можливості.

2. Застосування контент-аналізу

Список використаної літератури     

Наступний методичний крок полягає у перекладі змісту виділених фрагментів на формальну мову. Процедура контент-аналізу документів спрямована на виділення з тексту фрагментів, що відповідають найменшому, але цілісному модулю інформації в границях досліджуваної проблеми. У рамках такого модуля визначаються елементи проблеми, адекватні конкретним значенням класифікатора і між ними встановлюються зв'язки для наступної формальної передачі змісту фрагмента публікації за допомогою фасетной формули. Кожної з виділених цитат після її ретельного аналізу привласнюється сукупність визначених індексів (кодів), що відповідають конкретним значенням класифікатора і розташовуються в строго фіксованій послідовності у фасетной формулі. Таким чином, на основі розробленого класифікатора за допомогою фасетної формули ведеться формальний опис виділеного фрагмента тексту, а сукупність фасетних формул усіх виділених фрагментів забезпечує формальний опис документа в цілому (у контексті досліджуваної проблеми). Інформація, що не стосується проблеми, не виділяється з тексту і не заноситься в базу даних. Введений в інформаційну систему документ являє собою сукупність ключових фрагментів тексту (кожний з який заіндексований відповідно до його змісту). Процедура обробки публікацій — своєрідне інформаційне сито, що пропускає лише релевантну темі інформацію у вигляді фрагментів тексту. Серед переваг даної технології, слід зазначити зведення до мінімуму інформаційного шуму. Сформовані бази даних, зберігаючи текст оригіналу, — досить компактні і зручні в роботі. Серед недоліків технології — великі витрати інтелектуальної роботи як при обробці першоджерела, так і при наповненні баз даних. Трудомісткість технології обумовлена головним чином тим, що системи створюються на базі видань, електронні версії яких тепер не одержали поширення. Більш того, надзвичайно низька якість друку таких видань унеможливлює використання процедури електронного розпізнавання тексту. [17]

Запропонована процедура обробки публікацій є своєрідним «інформаційним ситом», що пропускає лише релевантну темі інформацію у вигляді екстрагованих з тексту фрагментів. Серед переваг даної технології, по-перше, слід зазначити відомість інформаційного шуму до мінімуму. По-друге, сформовані БД, зберігаючи у вигляді ключових цитат текст оригіналу, є досить компактними й зручними в роботі. Серед недоліків технології - більші витрати ручної праці, як при обробці першоджерел, так і при наповненні БД. Трудомісткість технології обумовлена головним чином тим, що системи створюються на базі газетних видань переважно регіонального походження, електронні версії яких у цей час не одержали поширення. Більше того, надзвичайно низька якість печатки таких видань унеможливлює використання процедури електронного дізнавання тексту зі сканера. У міру рішення видавничих проблем технологічний процес формування БД буде розвиватися в напрямку його поетапної автоматизації. [11]

Другий, технологічний етап контент-аналізу забезпечує аналітико-синтетичну переробку масиву вхідної інформації та її конвертування у зручні для споживачів аналітичні матеріали, скомпоновані у вигляді різних варіантів текстової складової (самих цитат) та статистичних показників. На цьому етапі використовуються програмні засоби та технологічні схеми, відпрацьовані спеціалістами. [15]

Запропонований спосіб представлення і розчленовування вхідної інформації дозволяє багатопланово використовувати її в процесі формування вихідних текстових файлів і при одержанні кількісних показників. [17]

Технологічно передбачені багатоаспектні комбінації цитат у рамках параметрів класифікатора. У якості домінантного може бути обраний кожний з елементів фасетної формули чи його окреме значення. Проблему можна представляти як комплексно, так і виборчо.

Таким чином, у технології проведення контент-аналізу інформаційного потоку на всіх етапах, як у технології обробки першоджерел і формування баз даних, так і в програмних засобах аналітико-синтетичної обробки інформації, передбачене різноманітне і багатоаспектне використання тематично обкресленої вхідної інформації. Аналіз і синтез включених у систему фрагментів дозволяють одержувати оригінальні інформаційні продукти. Вихідні файли можуть бути представлені у виді автоматично сформованих дайджестів (структурованих цитат публікацій з дотриманням визначеної ієрархії і порядку сортування) чи статистичних таблиць, тобто частотних характеристик досліджуваної проблеми. [17]

Інформаційні технології дозволяють вводити нові елементи, необхідні в окремих випадках конкретним споживачам. Технічно це зважується шляхом додавання у фасетную формулу нових фасет і відповідних їм сукупностей фасетних класів і їхніх індексів — у класифікатор. Таким чином, у процесі розвитку проблеми поповнюється і модифікується початковий варіант класифікатора, і, відповідно, удосконалюється сама система в плані можливостей аналізу проблеми.

Унікальність методології контент-аналізу складається також у тому, що вона не прив'язана ні до конкретного СУБД, ні до конкретних видів джерела інформації, ні до тематики інформації. [17]

Документ заноситься не як єдине ціле, а як сукупність окремих, незалежних одна від одної цитат. При її формуванні поняття «ключова цитата» стосується не тільки і не стільки тексту, з якого вона виділяється, скільки теми, котру відображає інфосистема. Тому не дивно, що «ключовий» відносно репрезентованої теми фрагменту контексті документа, з якого він виділяється, може виконувати другорядну роль або допоміжну функцію. Наприклад, бути поясненням до основного змісту тексту. [13]

Отже, фасетну формулу становлять взяті за строго фіксованою послідовністю індекси фасетних класів відповідних елементів проблеми та синтаксичні знаки; Індекси кожного попереднього фасету віддаляються від індексів наступного за допомогою крапки з комою (;). Для індексування вхідних матеріалів також передбачалися випадки, коли один елемент може одночасно мати кілька значень, вони фіксуються за допомогою індексів у конкретному місці фасетної формули (фасеті), відділяючись одне від одного комою (,). Класифікатор, це передбачено, не має бути консервативним за структурою і за змістом складових елементів. Він повинен розвиватися і вдосконалюватися згідно з розвитком проблеми. На рівні структури додаються нові елементи з сукупністю відповідних їм значень. Фасетна формула доповнюється адекватними цим елементам фасетами і фасетними класами. [13]

Щодо значень раніше виділених елементів, то деякі з них із часом відмирають або модифікуються, паралельно з'являються нові значення. Всі ці зміни також фіксуються на рівні індексів класифікатора проблеми. Тобто її розвиток відтепер передається за допомогою нарощування індексів у фасетній формулі та їх конкретним наповненням у класифікаторі.

Запропонований спосіб представлення та розчленування вхідної інформації від крив великі перспективи для подальших маніпуляцій з нею не тільки нарівні різних варіантів оглядових текстів, а й для отримання кількісних показників. [13]

Технологічно передбачено, що домінантним стосовно інших може бути будь-який фасет. Залежно від цього акценти розставляються на різних аспектах проблеми, представленої в комплексі, тобто з урахуванням усіх її параметрів, або частково. [13]

Неординарним є варіант виведення структурованого тексту в табличному вигляді. По вертикалі таблиці розмішуються фрагменти тексту згідно із заданою споживачем ієрархічною схемою, її ступенями можуть бути: об'єкт дослідження, досліджуваний суб'єкт, тема дослідження тощо. По горизонталі таблиці фіксуються модальність цитат, їх регіональна належність, джерела інформації й інші параметри. Для зручності споживачів у межах вертикальної ієрархії за кожним конкретним значенням елементів проблеми інформаційні модулі групуються згідно з ознаками, зафіксованими у горизонтальному розрізі таблиці, їх черговість та значущість задаються споживачами інформації. [13]

Запропонована технологія передбачає відбір фрагментів текстів із непрофільних для даної проблеми джерел, де вони виконують другорядну роль ремарок, пояснень тощо. Однак при відборі інформації потрібно дуже ретельно аналізувати першоджерела. Щоб досягти максимальних результатів, творці вхідної в БД інформації повинні добре розуміти не тільки матеріал, який опрацьовують, а й вивчити аудиторію споживачів та способи застосування ними даної інформації. Технологія систем сприяє її ефективному використанню, оскільки дозволяє вибирати з усього масиву занесених до БД документів лише ту інформацію і за тією послідовністю, в якій вона необхідна споживачеві - звичайно ж, у межах окресленого переліку варіантів її подання. За допомогою програмних засобів фрагменти текстів із різних першоджерел перетворюються у структурно організовані текстові блоки. [13]

У кожному конкретному випадку процесу побудови класифікатора передує структурний аналіз досліджуваної проблеми, суть якого зводиться до виявлення її складених елементів і зв'язків між ними. Після такої попередньої процедури будується граф проблеми, що відтворить у схематичному виді її модель від загальних понять (параметрів) типу: об'єкт дослідження; суб'єкт дослідження; досліджувана - тема до елементів проблеми в їхніх конкретних проявах. У рамках даної моделі кожному значенню виділених елементів проблеми привласнюється певний код (індекс). Це і є першим варіантом робочого класифікатора проблеми, організованого по фасетно-ієрархічному типі, у якому сукупність значень у межах кожного елемента представлена відповідними фасетними класами. [11]

Удосконалена система обробки БД являє собою сукупність інформаційних файлів, що акумулюють відомості про фасети, значення фасетных індексів і порядку сортування інформаційних модулів, а також файл конфигуратора. Останньому відведена провідна роль у технологічному процесі, оскільки він включає назви інформаційних файлів, використовуваних для індексування й сортування інформаційних модулів, назви БД, що зберігають ці модулі для подальшої обробки, назви вихідних файлів і т.д. Спеціально написані програмні засоби розбивають вхідний документ (інформаційний об'єкт) на окремі незалежні фрагменти (інформаційні модулі), автоматично постачаючи кожний з них бібліографічними даними, внесеними при описі документа в цілому. У результаті таких технологічних перетворень формується масив (мережа) ключових фрагментів публікацій, що представляє собою інформаційний відбиток досліджуваної проблеми. Крім того, кожен інформаційний модуль такої мережі при запуску відповідних програм розбивається на три незалежні складові, кожна з яких може функціонувати самостійно. Одна зі складових являє собою цитату документа (змістовна інформація), інша - повний бібліографічний опис документа і третя - фасетную формулу (структурна характеристика виділеного фрагмента тексту). Така технологічна процедура перетворює раніше сформований масив інформації в повну публікаційну матрицю, що піддається аналізу по кожнійій з виділених складових і по їх довільно заданій сукупності. [11]

Запропонований спосіб подання й розчленовування вхідної інформації дозволяє нею всіляко маніпулювати в процесі формування вихідних текстових файлів і при одержанні кількісних показників. [11]

Підводячи підсумки, слід зазначити, що використання контент-аналізу для створення інформаційно-аналітичних систем дозволяє вловити поширеність тієї чи іншої ознаки досліджуваної сукупності текстів. При цьому важливо не стільки абсолютне, скільки відносне значення ознаки, тобто характеристика її місця (частки) серед інших ознак. Вимір співвідношення між ознаками в текстах дає емпіричний матеріал для розуміння функціональних зв`язків між елементами відображеної в текстах дійсності. При наявності текстів, що мають хронологічну послідовність, можно мати низку фіксованих у часі "портретів" досліджуваної дійсності, що дає змогу висувати гіпотези прогностичного характеру про фунціонування елементів системи.


Список використаної літератури

1.Іванов В.Ф. Контент-аналіз: Методологія і методика дослідження ЗМК: Навч. посібник / Наук. ред. А.З. Москаленко. — К.,1994. — 112 с.

2.Кушнаренко Н.М., Удалова В.К. Наукова обробка документів: Підручник. — К.: Знання, 2006. — 331с.

3.Леонов В.П Реферирование и аннотирование научно-технической литературы. – Новосибирск: Наука, 1986. – 176 с.

4.Сорока М.Б. Національна система реферування української наукової літератури: Монографія / НАН України; Національна бібліотека України ім. В.І.Вернадського. — К.: Вид-во НБУВ, 2002. — 210с.

5.Сорока М.Б. Використання методу контент-аналізу при створенні автоматизованих інформаційних систем / М.Б. Сорока, Н.В. Танатар // Бібліотека. Наука. Культура. Інформація: Наук. праці Нац.б-ки України ім. В.І. Вернадського. – К.,1998. – Вип. 1 — С.318-322. 

Характеристика роботи

Контрольна

Кількість сторінок: 25

Безкоштовна робота

Закрити

Історична інформатика 5

Замовити дану роботу можна двома способами:

  • Подзвонити: (097) 844–69–22
  • Заповнити форму замовлення:
Не заповнені всі поля!
Обов'язкові поля до заповнення «ім'я» і одне з полів «телефон» або «email»

Щоб у Вас була можливість впевнитись в наявності обраної роботи, і частково ознайомитись з її змістом, ми можемо за бажанням відправити частини даної роботи безкоштовно. Всі роботи виконані в форматі Word згідно з усіма вимогами щодо оформлення даних робіт.