Курсовая работа: Автоматизація реферування
У Росії протягом більш 40 років функціонує реферативна служба на базі ВІН1ТІ, яка готує та видає реферативну інформацію з вітчизняних та зарубіжних публікацій. У ВІН1ТІ щорічно оброблюється біля 13 тис. зарубіжних журналів ЗО країн світу 60 мовами. У реферативні журнали (РЖ) ВІН1ТІ щорічно включається біля 1 млн рефератів. У 1995 році було видано 27 зведених томів РЖ, до яких увійшли 204 випуски з найбільш актуальних проблем науки та техніки.
Вся створена ВІН1ТІ реферативна інформаційна продукція та бази даних (БД) є інтелектуальною власністю ВІН1ТІ як юридичної особи; вони не можуть бути власністю якогось окремого підрозділу ВІН1ТІ.
Децентралізована підготовка та видання реферативної інформації спеціалізованими службами реферування прийнята у Німеччині, США та в інших країнах. Такі служби створюються за тематичним принципом у залежності від тематичної направленості самих служб. Однак треба відзначити, що децентралізація реферативної діяльності приводить до значного дублювання як в національному, так і в міжнародному масштабах.
Тому виникла ідея створення всесвітньої служби реферування, яка об’єднувала б реферативні служби різних країн . У межах такої всесвітньої служби окремі інформаційні органи повинні діяти на принципах координації та взаємодії. Кожна реферативна служба зобов’язується обробити літературу своєї країни для центрального або міжнародного реферативного центру. З свого боку центральна служба поставляє місцевим службам свої видання і БД та забезпечує їх іншими видами обслуговування . Тепер функції спеціального органу, що відає діяльністю реферативних і бібліографічних служб окремих країн, покладені на Реферативне бюро Міжнародної ради наукових спілок (РБ МРНС).
Згідно з Законом України "Про науково-технічну інформацію" одним з основних завдань національної системи НТІ України е реферування опублікованих та неопублікованих на території України джерел науково-технічної та економічної інформації.
Реферуванню підлягають всі результати науково-технічної діяльності, що опубліковані в книгах, брошурах,збірках, періодичних виданнях, інших джерелах інформації. Реферування всієї науково-технічної літератури та документації – це своєрідний обліково-реєстраційний механізм охоплення всього масиву вітчизняних публікацій, що видаються на терені України.
В Україні вже налагоджено обліково-реєстраційний механізм обробки результатів науково-дослідних та дослідно-конструкторських робіт (НДДКР). Діє, хоч і за старою схемою, механізм реєстрації і обліку депонованих рукописних робіт. Свою систему обліку та державної реєстрації мають патентна та нормативно-технічна документація. Бібліографічний облік вітчизняних публікацій, у тому числі в галузі науки і техніки, веде Книжкова палата України. Проте відсутність в Україні реферативних джерел приводить до втрат інформації, перешкоджає якісному обслуговуванню споживачів інформації, а також участі України в міждержавному обміні НТІ. Необхідно також відзначити, що реферативні журнали (збірники) у тих країнах, що їх видають, входять до складу обов’язкового набору інформаційних продуктів даної держави, без яких неможливе нормальне функціонування національної системи НТІ.
В Україні вже здійснюються спроби підготовки та видання реферативної інформації. Так, Черкаський центр інформації з хімічної промисловості видає реферативні збірники, що являють собою фактично збірники коротких оригінальних статей з проблем хімії та хімічної промисловості або ж містять виробничий досвід. "Медицинский реферативний журнал", який видає з 1994 року Республіканський центр наукової медичної інформації Міністерства охорони здоров’я України, містить реферати зарубіжних медичних періодичних видань. Інститут проблем реєстрації інформації НАН України з 1995 року видає український реферативний журнал "Джерело" (чотири рази на рік). Журнал містить авторські реферати статей, що публікуються лише у періодичних виданнях НАН України. Реферування кожного журналу здійснюється нетематично, незважаючи на те, що багато статей має міжгалузеве значення В журналі відсутній довідково-пошуковий апарат. Усе це не дозволяє вважати журнал повноцінним реферативним виданням.
Отже, в Україні вже тепер можна застосовувати систему реферування за двома схемами: децентралізованою та централізованою. Однак при застосуванні децентралізованої схеми в системі реферування буде задіяно багато різних міністерств та відомств, що викличе труднощі в координації цієї роботи. Тому доцільно застосовувати централізовану систему реферування.
Згідно з Законом України "Про видавничу справу" видання реферативних журналів покладається на Книжкову палату. Враховуючи те, що Книжкова палата України одержує обов’язковий примірник всієї друкованої продукції, має власну видавничо-поліграфічну базу, можна стверджувати, що вона має всі підстави стати провідною організацією у сфері реферування.
З метою підвищення оперативності та якості підготовки реферативних журналів та збереження бюджетних коштів було б доцільним застосовувати авторський реферат, який в обов’язковому порядку повинен супроводжувати рукопис документа, що видається.
Таким чином, запропонована нами організаційно-функціональна структура системи реферування має основним своїм ланцюгом центральний заклад з підготовки та видання реферативних журналів – Книжкову палату України. На неї повинні бути покладені такі функції:
• одержання від видавництв, реєстрація та обробка рефератів і формування бази даних рефератів;
• формування змістовної частини, оформлення та підготовка до друку випусків реферативних журналів;
• контроль за виконанням вимог нормативно-методичних документів щодо системи реферування;
• створення реферативних баз даних;
• довідково-інформаційне обслуговування в традиційному та автоматизованих режимах;
• здійснення в установленому порядку міждержавного обміну реферативного інформацією.
Пропозиції щодо фінансово-господарського механізму функціонування системи реферування складаються з вимог поширення чинності законодавства України, що стосується державної підтримки періодичних видань засобів масової інформації, на реферативні видання. Це дасть можливість одержати пільги та звільнення від податку на додану вартість на папір, картон та інші поліграфічні матеріали вітчизняного виробництва, а також на послуги підприємств поліграфії, зв’язку та транспорту.
Підготовка, видання та розповсюдження реферативних журналів ведеться на безприбуткових засадах. Саме фінансування робіт з підготовки та видання реферативної інформації повинне здійснюватись із держбюджету за державним замовленням та за рахунок коштів від розповсюдження реферативних видань.
3. Автоматичне реферування
Одним з класичних завдань комп’ютерної лiнгвiстики є побудова систем автоматичного реферування наукових, технiчних, полiтичних, дiлових текстiв. Актуальнiсть цього завдання значно зростає у зв’язку з появою на iнформацiйному ринку повнотекстових баз даних. Цi бази мiстять у виглядi документiв не реферати, а тексти наукових статей. У свiтлi сказаного в Главi 2 стає очевидною необхiднiсть вияву в кожному з таких текстiв найбiльш iнформативних речень, iнакше якiсть пошуку буде невисокою. Якщо ж iдеться про iншомовнi бази, то треба, очевидно, прагнути до побудови систем, якi iнтегрують 3 основнi функцiї: пошук, переклад i реферування. Розробка системи автоматичного реферування є можливою на основi експериментально-семантичного дослiдження мiжфразової структури тексту, з наступною реалiзацiєю IС, що володiють спроможнiстю гiперсинтаксичного “розумiння” текстiв.
3.1 Теоретичнi аспекти мiжфразового аналiзу
Одне з найважливiших лiнгвiстичних явищ - рiзне значення мовних одиниць в iзольованому станi та в бiльш складному мовному цiлому. Ще А.А.Потебня вiдзначав, що значення будь-якої граматичної форми проявляється по зв’язку з iншими формами в мовi та текстi [Потебня, 1958]. Звiдси можна зробити висновок, що принципову важливiсть має аналiз граматичних i семантичних явищ у контекстi, тобто моделювання їх поводження у текстi. При цьому очевидно, що контекст, взагалi кажучи, може вийти за рамки речення, так що внутрiшньофразовий опис вiдповiдних одиниць буде заздалегiдь помилковим. Мiжфразовi зв’язки реалiзуються в текстi двома засобами: експлiцитно та iмплiцитно. При розробцi систем автоматичної переробки тексту необхiдно враховувати цi розбiжностi у вiдносинах мiж реченнями; зрозумiло, що для їхнього моделювання необхiднi рiзнi апарати. З iншого боку, не треба розглядати вивчення цих зв’язкiв як принципово рiзнi завдання: для вияву в текстi iмплiцитних мiжфразових вiдносин необхiдно спочатку навчитися виявляти експлiцитнi вiдносини. Очевидно, що автоматизована система, що враховує при переробцi тексту тiльки експлицитнi вiдношення мiж реченнями, неминучо минає деякi мiжфразовi вiдносини лише тому, що вони не мають формального вираження. Велика кiлькiсть промислових iнформацiйних систем (наприклад, системи iндексування, перекладу), використовуючи тiльки “поверхнi” мовнi явища, як ми бачили, тим не менше, є досить ефективними. В данiй главi описуються теоретична база та реалiзованi на її основi автоматизованi системи, що аналiзують тексти на мiжфразовому рiвнi. Створення таких систем перес