Дипломная работа: Автоматизированная интеллектуальная система классификации информационных сообщений средств массовой

smi– расширение информационного сообщения СМИ.

3.3.2 Описание структуры информационной части сообщения СМИ

Текстовый файл сформирован без разбиения на страницы с сохранением оригинальной структуры публикаций (абзацы, красные строки и др.).

В состав текстового файла может входить несколько информационных сообщений.

При формировании текстового файла с 1-ой позиции на отдельной строке без пропуска строк введена информационная часть сообщения.

Информационная часть сообщения имеет следующую структуру:

АО ХХХХХХХ

==/СМИ

01/ХХХХ

02/ДДММГГ

03/ХХХХХХХХ

04/ХХХХХХХХ

05/ХХ

06/ключевые слова и текст статьи

07/наименование статьи

08/автор статьи

===

где АО ХХХХХХХ – адрес отправителя;

АО - заглавные буквы русского алфавита;

ХХХХХХХ - семизначный код отправителя.

Между буквами (АО) и кодом допускается один пробел.

==/ - признак начала информационной части (два символа "равно" и слеш - справа налево);

СМИ - принадлежность сообщения СМИ.

Каждое информационное сообщение отделяется этим набором символов.

Далее заполняются атрибуты с 1-й позиции по 8-ю:

01/ - четырехзначный код источника информации (код или наименование газеты);

02/ - дата публикации в формате ДДММГГ;

03/ - шести- или восьмизначный код региона;

04/ - наименование населенного пункта (или его 8-разрядный код), о котором пи­шется в статье газеты.

Атрибут заполняется заглавными буквами без указаний г., п., пгт. Под населенным пунктом подразумевается город, село, но не район области, не район города.

К-во Просмотров: 461
Бесплатно скачать Дипломная работа: Автоматизированная интеллектуальная система классификации информационных сообщений средств массовой