Да, я опять о тэгах, извините. Не буду тут описывать все прелести тэгового подхода к структуризации данных. Я о тэгах писала уже много (1, 2, 3, 4). Хотя в данном контексте понадобится, вероятно, лишь первая ссылка. Я понимаю прекрасно, что тема тэгов уже раскрыта давно, и что тэги уже являются привычным стандартом, и все привыкли и к ним, и к небольшим проблемам, с ними связанными, но…
Да, речь о фолксономии, конкретнее о том, что одно и тоже понятие могут обозначать разные слова. И тут даже не о синонимии речь, а даже если по минимуму брать – просто различное написание слов. Вот концепция Web 2.0. А Web2.0, Веб 2.0 и Веб2.0 – ведь абсолютно тоже самое. Мало того, что это путает, надо лезть в свои тэги смотреть, надо сверяться с чужими, что-то править, так еще насколько неудобно это для поиска.
Я так, коротенечко. Допустим, пощу я фотку во фликре, черно-белую. Ну и, соответственно, тэги к ней выставляю. Вся совокупность может быть такой: ч/б, черно-белое, чб, bw, b&w, black and white (не говоря уж о пробелах, дефисах, слэшах и/или их отсутствии). Ну так вот, я чет не понимаю, почему не существует еще некой системы упорядочивания тэгов. То есть, допустим, если все мои фотки были bw, а я вдруг пишу новый тэг – b&w – так почему мне не могут сказать: родная, у тебя есть тэг такой-то, хочешь его поставить? Я буду благодарна, чтобы не засорять. Просто сама по себе сторонник минимализма и порядка, на рабочем столе крайне мало всего и по необходимости, лишние вкладки в браузере всегда закрываю, и т.п. То есть, чтобы мне на основе вводимых тэгов подсказывали, что у меня уже есть. Ну да, есть такая вещь как автозаполнение. Полезная, безусловно, и отчасти она решает проблему. Но, простите, ведь black and white и white and black (немножко коряво, но для примеру) уже в автоазполнении не сработают, хотя суть одно и то же..
Далее, почему бы не сделать, чтобы мне выводилась подсказочка, мол, а ты знаешь, самый популярный тэг – это именно b&w, а не bw. Тут конечно дело вкусов, но кому-то такая информация не помешала бы. Если бы при этом еще бы сделали возможность идентификации слов в разных языках, типа b&w=ч/б, было бы вообще чудесно, хотя я может слишком много хочу? Ну просто при введении «ч/б», чтобы автоматом проставлялся аналог (да, я понимаю, что в этом случае нобходимо будет произвести некоторые настройки, но если уж любишь кататься..).
Ну или в сервисах закладок… Например сохраняю я статью с пометкой «UI», и чтобы система знала сама по себе, что данный тэг соответствует «user interface», и что, если кто-то вдруг будет искать среди закладок те, что помечены как user interface, то система должна выдавать и те, что помечены как UI (или ui, кстати, тоже), ну хотя бы как дополнительные варианты поиска.. на крайняк
Да, я прекрасно знаю о таких вещах как related tags (схожие тэги), это уже какой-то шаг, и может быть даже и решение проблемы… Но решать придется в итоге все равно юзеру. То есть я считаю, что такие процессы должны быть автоматизированы. И что если design и ui – это related tags, то уж ui и user interface – так это ваще одно и то же.
В общем, я тут распыляться не буду, просто интересно (ну и даже чуток возмущает, не без этого), почему нет каких-то.. алгоритмов или чего-нибудь, по упорядочиванию тэгов и уменьшению фолксономии. Ну не то что это зло, но в конечном счете нам-то самим и неудобно выходит.. Я, впрочем, понимаю, что это весьма нелегко сделать. Но сколько лет уже тэги существуют…
upd. Все-таки, чтобы сие происходило, необходимо, чтобы тэги, так сказать, угадывали значения друг друга и находили себе братьев по разуму, то бишь кучковались по определенным признакам. Как ни крути, без семантики здесь не обойтись. Но кто будет это делать? А вот юзеры. Вспомните время, когда тэги только начали приживаться. Вам не кажется, что это была некая игра, игрушка точнее, с которой можно играться бесконечно, пока не надоест, и которая никогда не закончтся?.. Это было интересно пользователям. Они клюнули. Вот не зря ж есть понятие «развивающие игры». Означает то, что любого можно научить чему-то через игру. И через игру оно будет легче учиться, потому что есть интерес, желание. Ну вот. Кароче, Склифасофский.. Юзерам под силу самим разгрести это болото и научить тэги друг друга узнавать. Естественно, этим будет заниматься меньшинство (вот для меня, например, до сих пор загадка, кто пишет Википедию? ну кто тоже пишет..). Но пользователям под силу самим указывать ассоциации, то, есть, например, записывать, с какими тэгами ассоциируется у него данный тэг, в какую категорию он отнес бы его. Само собой система должна быстро обучаться и показывать наглядно «вот видишь, не дура я вовсе, все ловлю на лету, только please.. be gentle»)). Просто надо дать людям легкость работы.. Заинтересовать их.. Ну да, пусть будет игрушкой.. Но сколько пользы? И вообще, вот есть у людей идеи, а они говорят – ну это все для юзеров, а кто из них будет это делать? Им же лень. Ну все верно… Им лень. Нам всем лень. Лень – следствие отсутствия интереса, только и всего.
А, так вот еще плюс ко всему надо, чтобы для всего этого прекрасного безобразия был один общий сервер, к которому могли бы подключаться различные сервисы, для которых актуальна такая тэговая проблема.. Заимствуют функцонал – отдают обработнные результаты.. вот чет типа того.. какой-то такой open tag. Вообще все это мне пришло в голову прошлым летом. И проблема, и сервисы, и open tag.. Задержалась я как-то, да?.. Есть ли смысл в этом всем? Ну есть.. только не уверена, что такой смысл, ради которого кто-то возьмется это делать.
Ну хотя бы да, когда статьи пишешь.. Ну автозаполнение порой помогает.. Но не панацея же. ТЕм более что это внешнее решение проблемы.
А ваще пиши истчо …
Допустим, я написал алгоритм удаления из базы тегов из одной и двух букв. Все на этом :).
Никто его не заставляет принемать окончательное решение, но сузить рамки принятия решения вполне реально, естественно, оставив окончательное решение за человеком.