Големина на текста:
ПЛОВДИВСКИ УНИВЕРСИТЕТ „ ПАИСИЙ ХИЛЕНДАРСКИ”
ФИЗИЧЕСКИ ФАКУЛТЕТ
ДИСЦИПЛИНА:
Компютърна лингвистика
ТЕМА:
Информационно търсещи системи
Разработил : Проверил:
Курс:
Фак. №
Специалност :
1. ОБЗОР НА СЪВРЕМЕННИ МЕТОДИ И ТЪРСЕЩИ СИСТЕМИ
Търсенето на информация е относително утвърдена технология, която се
използва за получаване на множество от свързани материали от голяма колекция.
Типичен пример за търсене на информация е търсенето по ключова дума в Интернет,
при което резултатът е страници, съдържащи тази ключова дума. Броят на намерени
страници, обаче, може да бъде много голям, а и по всяка вероятност, не всичко на
дадена страница ще е важно за потребителя. Оттук – преглеждането на всяка страница –
резултат на търсенето, с цел откриване на необходимата информация, много често е
трудоемка задача, изискваща значителен разход на време. Ето защо се налага процесът
на търсене да се допълва с извличане на информация, при което в намерените
документи се търсят определени фрази (представящи данни, факти и др.), които биха
представлявали интерес за потребителя. С други думи, документи с неструктурирано
съдържание се трансформират в структури от определен тип.
2. ИСТОРИЯ НА ТЪРСЕЩИТЕ СИСТЕМИ
В ранните дни на Интернет, броя на потребителите и наличната информация са
относително малки. Ресурсите на Интернет се използват от университети и лаборатории
с научноизследователски цели.
Каталози на сайтове
Един от първите начини за организиране на достъп до информационни ресурси в
мрежата се явяват каталозите на сайтове, където връзките към ресурси са групирани по
теми.
Април 1994 година - стартира първия подобен проект, сайта Yahoo. След като
броя на сайтовете в каталога Yahoo става значителен, е добавена възможност за търсене
на информация. Търсенето обхваща само информация съдржаща се в каталога.
Днес каталозите с връзки към сайтове не са актуални. Причината–
предоставят информация за малка част от Интернет. Най-добрият каталог в в
мрежата DMOZ (или Open Directory Project) съдържа информация за 5 милиона
ресурса, като в същото време базата данни на търсачката Google се състои от
повече от 8 милиарда документи.
Търсещи системи
1990г - създадена е първата търсеща система наречена Арчи (умалително на
английското archive, архив) от Алън Емтидж, студент в университета "МакГил" в
Монреал. Търсачката търси файлове на FTP сървъри.
1993г – създадена е първата истинска Web търсеща система Уондекс (Uondeks) от Матю
Грей. Тя осъществява търсенето с помощта на Web робот.
1994 година - реализира се проект за пълноценна търсеща система WebCrawler
1995 година - появяват се търсещите системи Lycos и AltaVista. Последната дълги
години бе лидер в областа на търсещи системи.
1996 г - основана е Alexa През 1998 е интегрирана в най-популярният тогава
браузър Netscape Navigator, а през 1999 в Internet Explorer на Майкрософт.
1997 година - Сергей Брин и Лари Пейдж създават Google в рамките на
2
изследователски проект на Стенфордския университет. Google придобива известност
чак през 2001 година. Днес Google, заедно с Yahoo и MSN Search са най популярните
търсещи системи в света. Те притежават собствени бази данни и алгоритми за търсене.
2004г - Майкрософт дебютира с бета версия на резултатите на собствен робот наречен
MSNBot. През 2005 започва да показва директно резултатите През 2006 година
Майкрософт започва да мигрира към новата платформа за търсене Microsoft Live
Search, а през 2009 създава нов продукт Bing.
Търсещите системи днес
По данни на HitWise делът на търсачките в световната Интернет аудитория е следният:
Google — 65, 0 %
Yahoo! — 20,73%
MSN — 8,46 %
Ask — 3,69 %
Други — 2,12 %
Търсещите системи утре
Търсещите системи постоянно се усъвършенстват и няма съмнение в това, че те ще
развиват:
Механизмите за индексиране на дълбоко скрити в сайтовете страници;
Нови възможности за разпознаване на автоматично генерирани страници;
Алгоритми за разпознаване и индексиране не само на HTML, но и на графики,
следене за новини, организация на резултатите от търсенето в логически
категории и т.н.
3. ВЪВЕДЕНИЕ В ИНФОРМАЦИОННОТО ТЪРСЕНЕ
Информационното търсене (ИТ) е определена последователност от операции,
които се изпълняват с цел намиране на документи, съдържащи определена нформация.
Целта на ИТ най-често е по-нататъшно предаване на документите или техните копия
или за получаване на фактически данни, т.е. справки, представляващи отговори на
дадени въпроси.
3

Това е само предварителен преглед

За да разгледате всички страници от този документ натиснете тук.
Последно свалили материала:
ДАТА ИНФОРМАЦИЯ ЗА ПОТРЕБИТЕЛЯ
29 ное 2021 в 22:36 студент на 22 години от София - УНСС, факулетет - Финансово-счетоводен, специалност - Финанси, випуск 2022
 
Подобни материали
 

История на Интернет


Всичко започва през 1969г. с проект на Министерството на отбраната на САЩ – мрежата ARP Anet. В началото това е просто експеримент за предаване на секретна информация.
 

Интернет търсачки, web класиране и индексиране


Интернет търсачките използват роботи (crawlers) /специализирани програми/, които индексират /търсят и събират информация/ в интернет, сайт след сайт, страница по страница.
 

Употреба на Интернет


Преди повече от 20 години Интернет беше създаден, за да осигури на университетите, правителствените агенции и други изследователски институции в САЩ, начин да обменят файлове и информация.
 

База от данни


Файлова организация и база данни. Модели на база данни. Проектиране на база данни...
 

Глобална мрежа Internet

16 мар 2008
·
395
·
4
·
307

През 1967 г. министерството на отбраната на САЩ представя проект наречен ARPANET, чиито основна цел била да се разработи мрежа, която: да работи с различен хардуер; да свързва както отделните компютри така, и компютърни мрежи;...
1 2 3 4 5 » 10
 
Онлайн тестове по Информационни технологии в социалната работа
Информационни технологии
изпитен тест по Информационни технологии в социалната работа за Студенти от 2 курс
Тестът съдържа 23 затворени въпроса, всеки от които изисква един или повече верни отговора.
(Лесен)
23
6
1
5 мин
19.01.2015
Tест word - базови умения
тематичен тест по Информационни технологии в социалната работа за Ученици от 9 клас
Тестът е предназначен за проверка на базови умения за работа в текстообработваща среда MS WORD. Може да се ползва за упражнение или контрол.
Тестът е изготвен от:
Диана Николова преподавател
(Лесен)
16
126
1
1 мин
27.09.2011
» виж всички онлайн тестове по информационни технологии в социалната работа

Компютърна лингвистика

Материал № 1290712, от 03 юли 2017
Свален: 17 пъти
Прегледан: 28 пъти
Предмет: Информационни технологии в социалната работа
Тип: Курсова работа
Брой страници: 15
Брой думи: 4,323
Брой символи: 27,791

Потърси помощ за своята домашна:

Имаш домашна за "Компютърна лингвистика"?
Намери бързо решение, с помощтта на потребители на Pomagalo.com:

Последно видяха материала