Семантический Веб, попса и деньги. Когда? (Часть 2)

Итак, мы выяснили, что маркетинговым и вирусным потенциалом скорее обладает TD подход к Семантическому Вебу. Идем далее. Мы даже выяснили, что таких приложений уже есть, а значит практиш семантик не стоит на месте, развивается и взрослеет. В любом случае, нужна БОМБА. Нужно нечто, что попадет в массы и завоюет сердца пользователей. Которым, кстати, абсолютно наплевать, «что же там спрятано внутри», им нужна легкость, понятность, фишки, интересненькое и веселенькое.

И это пользовательское приложение, которое сумеет взорвать Веб первым, должно быть такое обалденное, чтобы людям сразу захотелось понять и признать, что Семантик Веб – это круто. Вот именно с него начнется настоящий рынок. Если один семантический сервис настолько интересен, то и другие ведь могут быть. Сейчас мы и рассмотрим нескольно сфер развития семантических приложений и посмотрим, способно ли какое-нибудь из уже существующих создать рынок и стать этой самой бомбой.

Естественный язык

С самого начала Семантик ассоциировался с Искусственным Интеллектом. Идея того, чтобы предоставлять компьютерам структурированную информацию, чтобы они понимали нас и решали трудные задачки за нас была одной из краеугольных в понимании Семантического Веба. Но проблема в том, что предоставление миллиардов страниц в RDF – практически невозможная задача. Альтернатива – научить компьютеры понимать наш естественный язык. То есть, если машина будет читать страницу таким же образом, как и мы ее читаем, и понимать ее, то в объяснении компьютеру смысла надобность отпадет.

В общем NLP – мечта любого искусственного интеллекта!)) Но, как мы говорили, это очень сложно, почти невозможно. Конечно, если бы это все-таки произошло, то было бы чудесно, и вполне возможно именно это и стало бы бомбой. Но пока.. увы.. не видно ничего подобного на горизонте. Семантические технологии на сегодня не способны объять естественный язык, да это даже их целью-то и не является. Даже если бы и можно было понять каждую страницу, то все равно остался бы вопрос как семантически ее интерпретировать, а это подвластно только человеческому мозгу.

Джин в бутылке

С проблемой естественного языка тесно связана еще одна, под кодовым названием «джин в бутылке». Бытует мнение просто, что Семантический Веб призван решать какие-то сложные человеческие задачи. Но это вовсе не так. Ведь нельзя просто так прийти первый раз в туристическое агентство и сходу взять путевку на идеальный отдых. Потому что идеальность – субъективна, а турагент не может знать ваши ощущения и предыдущий опыт. Это целый процесс.

Да, Семантический Веб подразумевает под собой структуриованнуюинформацию, но это не значит совсем, что компьютер будет решать вам сложные задачи. То, что у вас есть карта, еще не означает, что вы знаете лучший маршрут из пункта А в пункт Б. Карта обязательна, но ее недостаточно, нужен еще какой-то алгоритм, чтобы найти этот маршрут. А вы еще спрашиваете, куда бы вам податься отдохнуть. Компьютеры никогда не смогут давать нам абсолютно точный, идеальный ответ. Да, если бы такое было возможно, это было бы бомбой. Но это невозможно.

Семантические базы данных

Что же есть на сегодняшний день? Семантические базы данных, как, например, Freebase и Twine. Freebase в основном фокусируется на том, чтобы создать семантическую Википедию. Twine же больше уделяет внимание личным семаническим базам данных. Они оба семантические, оба управляют информацией (знаниями типа) и оба похожи на Википедию. Но у них есть преимущество: они предоставляют структурированную информацию и поддерживают запросы. Вот пример «выдачи» в Freebase и Wikipedia. Они выглядят похоже в общем, но Freebase «знает», чтоAlicia Keys – это блюзовая певица и знает и других блюзовых певиц. В Википедии блюз – просто еще одна страница, а не понятие жанра. То есть Freebase может рассказать более или менее связно о блюзе и его представителях, а Википедия нет.

Нет, это, конечно, здорово, но есть вопрос: а кому до этого есть дело? Конечный потребитель увидит разницу? Вряд ли. Википедия содержит определения огромному количеству понятий, в ней также легко искать и находить информацию, и по ходу людям (мы всегда говорим об основной массе ведь) лучшей Википедии и не нужно. Может быть с Twine ситуация чуть другая, потому что скорее всего людей, которые хотят управлять своей информацией, своими знаниями, существенное количество. Другой вопрос: разве знание семантики информации поможет вам построить самое лучшее приложение?

Кроме того, чтобы стать бомбой, надо завоевать сердца людей. С семантическими базами данных это вряд ли произойдет. Библиотеки и базы данных, хоть и не можем мы без них, мы все равно воспринимаем как должное. Знаний полно в Гугле и Википедии и в блогосфере, они скучны и не возбуждают умы и фантазию.. По этой причине семантические базы данных, скорее всего, не будут бомбой, но могут стать существенным рубежом на пути к ней.

Семантический поиск

Это был самый первый кандидат на бомбу. Сначала Hakia, затем Powerset распространили идею о том, что поисковик, который понимает естественный язык, может «побить Google». И сами себя связали этим. Этим компаниям теперь придется выдавать не только на порядок лучшие результаты, но и хотя бы приблизительно решить проблему понимания естественного языка))

Но глядя на сегодняшнее положение вещей, нельзя сказать, что сематический поиск – это бомба. Понимание естественного языка на самом деле не дает таких уж огромных преимуществ в поиске. Сами можете попробовать. Алгоритм Гугла точен и хорош, именно поэтому он лучший в поиске уже 8 лет как. Чтобы побить Гугл нужно нечто большее, чем улучшенный алгоритм, скорее изменение парадигмы восприятия Веба, что ли.

Социальный граф

После того как Тим Бернерс-Ли выразил некоторые свои мысли насчет социального графа, это стало довольно популярной темой, люди интересовались, а является ли социальный граф семантическим вебом. Но это скорее от неправильной интерпретации его слов. Социальный граф не является семантическим вебом, и уж точно не будет семантичской бомбой-приложением. Это совершенно разные понятия. Запутало эти понятия то, что они оба являются математическим графом или сетью. А то, что под ними предполагается – это понятия, связанные ссылками. Но многие вещи в природе и обществе являются сетями, так или иначе, поэтому неудивительно, что и люди, и значения попали в эту категорию.

Было бы правильнее сказать, что социальный граф это скорее некое подмножество семантического веба. Знать, как люди соединены между собой – важно, хотя бы для того чтобы выбрать идеальный отдых. Ведь идеальный отдых должен быть проведен с идеальными друзьями)) Но вообще-то, хоть социальный граф – это важный тренд 2008, но это не семантический веб.

Ярлыки

Ну а в последнее время получают распространение и другие семантические приложения, которые можно обозвать ярлыками (shortcuts). Это SnapShot (Snap), Blue Organizer и SmartLinks (AdaptiveBlue), Shortcuts (Yahoo!) и внутритекстовый поиск от Lingospot. Эти приложения используют простую семантику данного контента, чтобы предоставить дополнительную информацию. В случае Snap и AdaptiveBlue, семантика определяется url-ом, в случае Yahoo! и Lingospot – посредством текстового анализа.

Все эти приложения предоставляют схожую информацию через аяксовые pop-ups. Они использут семантику, чтобы вытянуть информацию из сети. Это позволяет открывать юзеру новое и делать «обратный» поиск. Человек рассматривает книгу и видит краткое описание ее, когда смотрит музыкальный альбом, то может нажать кнопку play, когда изучает новый фильм, может просмотреть трейлер. Ярлыки отнимают необходимость искать, нужная информация сама выдается на странице.

Сейчас ярлыки весьма просты и в стадии зарождения, но уже они являются успешными примерами семантических приложений. Но мы не можем назвать их бомбой по некоторым причинам:
- люди воспринимают их как рекламу. Snap довольно рано внедрил рекламу. Однако, эти приложения не делаются ради ркламы. И это не главное.

- В том виде, в котором есть сейчас ярлыки, это инструменты. Как люди не будут прыгать от счастья, используя базы знаний, так и ярлыки они будут воспринимать как нечто само собой разумеющееся.

Да, у ярлков больше всего шансов. В дальнейшем эти приложения будут более быстрые и точные. Они будут извлекать контент и микро-контекст, чтобы избавить от необходимости поиска. Они будут становиться тем более персонализированны, чем больше их исползуешь. Когда это случится – это будет очень хорошо и полезно.

В итоге

Пока непонятно, что же может претендовать на то, чтобы поставить Веб на колени. Алекс говорит о ярлыках, но возможно, это не очень объективное мнение, т.к. он владелец двух таких продуктов (хотя, скажу честно, из предыдущих статей Алекса я не могу сделать вывод, что он подвержен предубежденности, поразительно трезвые рассуждения у него). В общем-то, эта статья и заканчивается тем, что «будем ждать».

Да, все верно, Семантику нужны те приложения, которые могут просто и оригинально показать, что этот самый семантик полезен и хорош. По моему мнению ничего из этого не способно взорвать рынок (которого, впрочем, нет еще), а ярлыки на мой взгляд – вообще еще не скоро в наши края придут, да и выглядят некоторые такие приложения довольно пугающе (Наверное самое распространенное у нас – это SnapShot). Никакая социалка, самая семантическая, информационая и удобная не сможет уже пробиться наверх. Приложения-инструменты – частенько бывают пугающими или к ним очень долго привыкают. Если что-то и способно пробиться, то нечто вообще концептуально новое. Каким, например, являлся Твиттер. Кароче, такое же, но с перламутровыми пуговицами. То есть семантическое. Честно говоря, я теряюсь в догадах…

rss feed комментариев

Комментарии(18)

Nicholass:

12 Январь 2008 в 00:29

Ммм. Веб 3.0
Про путевку:
Веб 3.0 предполагает работу с неявной инфрмацией, к примеру карта интересов. Это немного упрощает работу.
Семантическая википедия нужна не людям, она нужна машинам. Создание словарей и тезаурусов позволит компьютеру «понимать» связь между понятиями и опять же делать более умные выводы, например о ваших вкусах. То есть если вам нравится «Astral projection», «Hallucinogene», «Shpongle» то скорее всего вам нравится psy/goa trance и вас может заинтересовать такая вот кча исполнителей. И не нужно преобразование Байпса, которое сейчас используется для подсчета вкусов. Или у вас в профиле интересов написано, что вы любите Чака Паланика и группу «The Dust Brothers» система посоветует вам фильм «Бойцовский клуб» и по существующим связкам поможет вам его найти.

А вообще у меня давно назрела идея написать пост-ответ всем сомневающимся в Веб 3.0
Так что ждите разъяснений.

Ответить
links for 2008-01-12:

12 Январь 2008 в 03:30

[...] Семантический Веб, попса и деньги. Когда? (Часть 2) Итак, мы выяснили, что маркетинговым и вирусным потенциалом скорее обладает TD подход к Семантическому Веб [...]

Ответить
Тормоз:

12 Январь 2008 в 04:25

Извиняюсь за небольшой оффтоп, но на мой взгляд этот гребаный SnapShot – самое мудацкое изобретение в сети. Терпеть ненавижу сайты, в которые он встроен. Например ЖЖ. Раньше был относительно неплохой платформой, теперь же вечно тормозящее заскриптованное убожество, и конечно же с этими уродскими скриншотами, которые загружаются без спроса. Р-р-р…

Ответить
phoenix:

13 Январь 2008 в 06:55

да, первое, что я сделал, увидив этот выкидыш воспалённого мозга – послал создателям луч летальной диареи, второе – отключил это нафиг.

Ответить
Arina:

13 Январь 2008 в 15:40

«Веб 3.0 предполагает работу с неявной инфрмацией, к примеру карта интересов. Это немного упрощает работу.» – что за кошмар? :-)

Ответить
Eugene:

13 Январь 2008 в 21:58

Дамочка, либо пишите семантический, либо латинскими буквами это слово. А не какой то там «семантик».

Ответить
seobaby:

13 Январь 2008 в 22:03

ишь ты.. привиреда какой..

Ответить
star:

14 Январь 2008 в 04:27

А многое из сказанного ведь сущая правда :)

Ответить
Карелин:

16 Январь 2008 в 17:57

Я думаю, что здесь бы никто и ничего не говорил, если бы это не являлось «сущей» правдой :)

Ответить
Тартар:

18 Январь 2008 в 03:40

А чего ваша правда боится? =)

Ответить
Гуманный Блоггер:

26 Январь 2008 в 11:13

Думаю, веб 3.0 придет так же неожиданно, как и его предыдущая версия.

Ответить
Nicholass:

26 Январь 2008 в 18:09

Дааа, вижу я нужно написать «Будущее тут: веб 3.0″

Ответить
Будущее тут: Веб 3.0* | Футуриус:

26 Январь 2008 в 23:20

[...] сейчас не используется), Дамочка в поиске, к примеру, рассматривала GGG, какие-то диковинные поиски от Yahoo!. Самым, на мой [...]

Ответить
Tatyana:

29 Январь 2008 в 14:00

Саш, может, тебе интересно будет
«W3C публикует спецификации SPARQL, ключевого компонента Semantic Web»

Можно, например, представлять себе Semantic Web в виде одной огромной базы данных», – заметил представитель W3C Ян Джекобс. База данных, по его словам, позволяет формировать запросы и работать с данными. Он уверен, что будет появляться все больше сайтов, похожих на базы данных.
Если же сопоставлять Semantic Web с поисковыми механизмами, такими как Google, то последний поддерживает поиск в тексте документа, а Semantic Web позволяет автоматизировать и объединять данные.

Ответить
Nicholass:

29 Январь 2008 в 22:52

2 татьяна
Я писал об этом же (комментарий выше)

Ответить
Mixail Davydovi4:

21 Февраль 2008 в 10:55

ага. надо сразу про 3.0 писать. это будет актуальнее:-))

Ответить
Typak:

28 Февраль 2008 в 10:11

SnapShot ужасно меня раздражает, зачем его устанавливают к себе на блоги ума не приложу. совершенно бесполезная и тормозящая загрузку страниц вещь.

Ответить
Lynx:

13 Март 2008 в 12:34

Кучка околоайтишного кривляния. Пост можно было сделать в три раза короче.

Ответить

Seobaby

Автор/Время:

Теги:

Семантический Веб, попса и деньги. Когда? (Часть 2)

Please, feel free to post your own comment