Инфицированы будущим
При поддержке

Конкурс «Технологии спасения» завершён, идёт оценка работ.

ФутуродромБудущее интернета: семантическая паутина, или Web 3.0

Откройте любую статью в википедии. Ну, например, про Хаббл. Объемный и выверенный тысячами правок текст, детальное описание всех систем телескопа, хронология его строительства и результаты работы, десятки фотографий, еще сотни — по прилагаемым ссылкам, аудиоверсия статьи, описания сервисных миссий шаттлов, по ссылкам — поминутные хронологии каждого из этих полетов, десяток внешних ссылок и сто пятьдесят ссылок на источники. Да, википедия — это грандиозный проект, вебдванольный в классическом смысле этого слова. Но...

Как-то в процессе написания работы, темой которой было сравнение родов Populus и Salix семейства Salicaceae, мне понадобились ареалы типовых видов этих родов и данные их сравнительного генетического анализа — каков процент различий, в каких хромосомах различия наибольшие, и когда произошла дивергенция этих родов и каждого из их типовых видов.

В английской википедии не оказалось ничего из этого, а в русской неожиданно нашлась только лишь короткая фраза, относящаяся к иве — «отпечатки попадаются в меловой формации, в четвертичную эпоху жили уже современные виды». (Что оставляет нам разброс порядка 140 миллионов лет.) Картинки с ареалами в итоге нашлись в гугле — обе были из какой-то советской энциклопедии, и отображали ареал только на территории СССР, а сравнительного генетического исследования этих родов в интернете так и не обнаружилось, хотя к настоящему времени такие исследования уже проведены для очень многих видов, и уж тем более — для таких распространенных растений, как ива и тополь.

И где-то пылятся сейчас на сервере какого-нибудь университета данные об этих исследованиях. Потоки и объемы информации быстро увеличиваются, и тысячи, миллионы других научных сведений разбросаны в разных форматах и в разном виде по бесчисленным серверам и университетским кластерам. Человечество генерирует огромное количество данных каждый день, но мы все еще не умеем должным образом их обрабатывать. Да и мы ли должны это делать? Ведь у нас есть устройства для обработки данных — компьютеры. Но почти все существующие форматы файлов делаются для людей, не для компьютеров, да и несколько компьютерных баз данных, созданных независимо друг от друга, очень сложно объединить... Так появился концепт семантической паутины, или семантического веба.

sw-horz-w3c.png

Читать далее

  15
© 2012 Trend Club