Реферат: Інтернет-ресурси та бази даних

Наведемо роз’яснення деяких термінів, які використовуються в WWW —журналіст безперечно повинен знати їх, бо рано чи пізно зіткнеться з ними і вони не повинні викликати ускладнень. Перший термін — HTML (hyper text markup language, мова розмітки тексту). Це формат гіпермедійних документів, які використовують в WWW для представлення інформації. Цей формат не описує те, як документ повинен виглядати, а його структуру і зв’язки. Зовнішній вигляд документа на екрані користувача визначається навігатором — якщо користувач працює за графічним або текстовим терміналом, у кожному випадку документ на екрані матиме різний вигляд, але його структура залишиться незмінною, оскільки вона задана форматом html. Імена файлів у форматі html, як правило, закінчуються на html (або мають розширення htm у випадку, якщо сервер працює під Windows). Другий термін URL (uniform resource locator, універсальний вказівник на ресурс). Таку назву носять посилання на інформаційні ресурси Internet. Ще один термін – HTTP (hypertext transfer protocol, протокол передачі гіпертексту). Таку назву носить протокол, за яким взаємодіють клієнт та сервер WWW.

Домен (англ. Domain) — частина простору ієрархічних імен мережі Інтернет, що обслуговується групою серверів доменних імен (DNS-серверів) та централізовано адмініструється.

DNS-сервери зберігають інформацію про вузли, які належать домену і виконують перетворення їх імен в адреси. Кожний домен має унікальне ім'я, а кожен комп'ютер, підключений до Інтернет, обов'язково потрапляє в один із доменів. Домени взаємодіють між собою за ієрархічним принципом. Два домени, що знаходяться на сусідніх рівнях ієрархії, називаються відповідно доменом вищого та нижчого рівнів. Домени найвищого (верхнього) рівня можуть бути сформовані за організаційним або географічним ознаками. Домени, сформовані за географічним ознаками, об'єднують вузли, що належать конкретній державі. За географічними ознаками об'єднуються в основному комп'ютери, що містяться на території США [3].

2. Поняття «бази даних»

База даних (БД) — впорядкований набір логічно взаємопов'язаних даних, що використовується спільно, та призначений для задоволення інформаційних потреб користувачів. У технічному розумінні включно й система керування БД.

Головним завданням БД є гарантоване збереження значних обсягів інформації (т.зв. записи даних) та надання доступу до неї користувачеві або ж прикладній програмі. Таким чином БД складається з двох частин — збереженої інформації, та системи управління нею. З метою забезпечення ефективності доступу записи даних організовують як множину фактів (елемент даних).

2000-ні рр. головним нововведенням є підтримка та застосування XML у БД. Розробники комерційних БД, які панували на ринку у 1990-их рр., отримують все більшу конкуренцію зі сторони руху відкритого програмного забезпечення. Реакцією на це стає поява безкоштовних версій комерційних БД [3].

Інтернет-журналісти дістають більшу частину інформації за допомогою комп’ютерів, але не завжди це найліпше джерело інформації. Специфіка певного ЗМІ може «відіслати» вас до старомодних друкованих джерел.

Місцеві публічні та університетські бібліотеки також можуть надати велику допомогу з матеріалами, адже це своєрідні бази даних.

Більшість ЗМІ також мають різноманітні довідкові матеріали – адреси місцевих підприємств і державних установ, що містять найрізноманітнішу корисну інформацію місцевого і регіонального характеру.

Сьогодні більшість баз даних державних органів доволі сучасні і перенесені в Інтернет. До них часто мають доступ університетські бібліотеки, що забезпечують студентам, викладачам та науковцям умови для проведення досліджень. Також можна скористатись і центральною публічною науковою бібліотекою міста.

Проте, незважаючи на величезну кількість інформації в Інтернеті, якщо ви користуєтесь офіційними базами даних державних органів, то слід обов'язково зважати на авторські правата інші обмежувальні правові чинники [2].

3. Пошукові машини в Інтернеті

Пошукова система онлайн-служба, яка надає можливість пошуку інформації на сайтах в інтернеті, а також (можливо) у групах обговорення та ftp-серверах.

Індексація в пошукових системах сайтів здійснюється пошуковим роботом.

Основними критеріями якості роботи пошукової системи є релевантність, повнота бази, врахування морфології мови [1].

Сьогодні найрозповсюдженішими та тими, які найчастіше використовуються є такі пошукові машини:

META

Український пошуковий портал в Інтернет. Використовує пошукову систему власної розробки з українською, російською та англійською мовами пошуку. Зона пошуку — українські сайти та сайти, що стосуються України.

Належність сайтів до українського сегменту мережі визначається наступним чином:

- сайти в домені UA та під доменах (com.ua kiev.ua тощо);

- українська мова сайту;

- хостинг на IP українських провайдерів;

- основна тематика сайту (будь-якою мовою) стосується України.

Внаслідок певних технічних складнощів з визначенням належності сайту до України, у випадках 3-4, тобто коли сайт знаходиться в доменах першого рівня (.com, .net, .org тощо) і використовує не українську мову, бажано додавати сайт до пошуку в ручному режимі. МЕТА підтримує українську, російську та англійську морфологію.

Google Inc.

Американська корпорація, заснована 7 вересня 1998 року як приватна компанія, що займається розробкою, розвитком і дизайном найпопулярнішого в Інтернет пошукового сервісу. В компанії, головний офіс якої розташованій в Маунтін В'ю, Каліфорнія, працюють близько 16 000 робітників.

Назва «Google» — спотворене написання слова «гугол» (англ. googol), яке придумав Мілтон Сіротта, племінник американського математика Едварда Кайзера. «Гугол» — це число 10100, десятковий запис його містить одиницю та сто нулів.

Лідер пошукових машин Інтернет, Google займає 65% світового ринку[1]. Наразі Гугл щоденно реєструє близько 50 млн. пошукових запитів та індексує більше 8 мільярдів веб-сторінок. Google може знаходити інформацію 101 мовою. Google наприкінці серпня 2004 року складалась з 132 тис. машин, розташованих в різних точках планети (джерело інформації — колишній високопоставлений співробітник компанії.

Інтерфейс Google містить досить складну мову запитів, що дозволяє обмежити область пошуку окремими доменами, мовами, типами файлів тощо. Наприклад, пошук «intitle:Google site:wikipedia.org» видасть всі статті Вікіпедії всіма мовами, в заголовку яких зустрічається слово «Google».

Я́ndex

К-во Просмотров: 165
Бесплатно скачать Реферат: Інтернет-ресурси та бази даних