Дипломная работа: Автоматизированная интеллектуальная система классификации информационных сообщений средств массовой
smi– расширение информационного сообщения СМИ.
3.3.2 Описание структуры информационной части сообщения СМИ
Текстовый файл сформирован без разбиения на страницы с сохранением оригинальной структуры публикаций (абзацы, красные строки и др.).
В состав текстового файла может входить несколько информационных сообщений.
При формировании текстового файла с 1-ой позиции на отдельной строке без пропуска строк введена информационная часть сообщения.
Информационная часть сообщения имеет следующую структуру:
АО ХХХХХХХ
==/СМИ
01/ХХХХ
02/ДДММГГ
03/ХХХХХХХХ
04/ХХХХХХХХ
05/ХХ
06/ключевые слова и текст статьи
07/наименование статьи
08/автор статьи
===
где АО ХХХХХХХ – адрес отправителя;
АО - заглавные буквы русского алфавита;
ХХХХХХХ - семизначный код отправителя.
Между буквами (АО) и кодом допускается один пробел.
==/ - признак начала информационной части (два символа "равно" и слеш - справа налево);
СМИ - принадлежность сообщения СМИ.
Каждое информационное сообщение отделяется этим набором символов.
Далее заполняются атрибуты с 1-й позиции по 8-ю:
01/ - четырехзначный код источника информации (код или наименование газеты);
02/ - дата публикации в формате ДДММГГ;
03/ - шести- или восьмизначный код региона;
04/ - наименование населенного пункта (или его 8-разрядный код), о котором пишется в статье газеты.
Атрибут заполняется заглавными буквами без указаний г., п., пгт. Под населенным пунктом подразумевается город, село, но не район области, не район города.