All I need is metadata

Когда в качестве носителя информации для музыки в ходу были виниловые пластинки и CD-ROM, а для видео DVD и Blue-ray, люди собирали коллекции любимой музыки и фильмов, храня это всё в специальной этажерке с прорезями для дисков. Кстати, официальный CD с музыкой стоил довольно дорого.

Потом все начали хранить на жёстком диске сотни мегабайт Mp3 и слушали это всё странноватым Winamp-ом (он ещё жив).

С книжками та же история: комнаты, полные бумаги.

Переезжая с одного макбука на другой, я понял, что основная ценность iTunes для меня это не хранение Mp3-файлов, а хранение моего отношения к каждому из этих файлов: какой рейтинг я ему поставил, какой жанр я ему назначил вместо “Tropical”, в какой плейлист я его сгруппировал.

Контент сегодня настолько легко доступен, что его наличие и хранение перестали быть проблемой. Файлы можно послушать из YouTube и десятка стриминговых сервисов, скачать по торренту, и всё ещё купить на CD.

А вот хранение плейлистов и рейтингов это проблема, которую никто не осознаёт.

Заключается она в том, что для хранения текстового файла с названиями, который можно было бы легко записать в JSON / YAML (но надёжнее было бы хранить как SQLite или даже сделать БД в Postgres) мы используем кучу разных программ, для каждой области жизни свою: чтобы хранить плейлисты и рейтинги музыки это iTunes, для видео это IMDB или Netflix, а соцсети для хранения подписок на людей и лайков.

Одна из ключевых ценностей соцсети это то же самое хранение связей: на кого я подписан, какие твиты я лайкнул, какой комментарий я оставил. Даже хранение фото и видео может не являться функцией соцсети: фото можно хранить в каком-то другом сервисе типа Flickr или просто в AWS S3, а в посты вставлять URL картинки или какой-то универсальный идентификатор, если бы существовал открытый протокол адрессации таких фото.

Т. е. можно представить модель, когда человек пишет пост в одном месте, линкует в него фото из S3 и публикет в несколько соцсетей.

А при переезде из одной сети в другую (сейчас вот часть пользователей Twitter пытаются переползти в Getter или Gab, а пользователи YouTube в Odysee и Rumble) человеку нужно будет только зарегистрироваться и подключить интеграцию со своей базой данных.

Update: Набрёл в сети на концепцию «personal data warehouses» в статье у Simon Willison, где он рассказывает про 2 своих проекта / сервиса — Datasette и Dogsheep