Искусство рядом. Грабь, делись, просвещай

Сколько-то лет назад (2011-2014) занимался я такой фигней, как извлечение отсканированых картин известных и не очень художников с сайтов разных музеев. Мне за это чуть-чуть приплачивали, иногда даже было интересно. Картины были в высоких разрешениях, близких к оригинальному размеру.

Посмотреть на сайте их можно было через такие виджеты, которые похожи на Google Maps: есть основной холст с изображением картины и есть слайдер-увеличитель. Крутишь слайдер — получаешь копию более высокого качества. Работали такие виджеты примерно одинаково: скан картины разбивается на много квадратов (тайлов) и на каждом уровне увеличения свой набор тайлов с соответствующей детализацией.

Музеи конечно не хотели просто так отдавать картины, поэтому как могли(никак не могли) шифровали свои алгоритмы дробления картин и урлы загрузки этих тайлов.

Так вот суть задачи была в том, чтобы разобраться в алгоритме виджета на сайте конкретного музея, написать грабер (тогда на php писал), ну и можно его использовать.

А сейчас на всяких гуглах уже существуют проекты типа Google Arts & Culture, куда приходишь и тоже можешь потыкать такие же виджеты, поелозить слайдеры, поглазеть шедевры и тд.

Вот к примеру, творчество Санти Рафаэля Петровича.

Но что еще! Не я один разгадывал где картинки лежат. Разные люди этим тоже занимаются, да еще и в open source свои поделки выкладывают.

Из примечательного:

  • gapdecoder скрипт для того самого Google Arts & Culture.
  • dezoomify веб-сервис, парсит целый набор zoom-сервисов.
  • dezoomify-rs самая серьезная поделка из тех, что я встречал. Консольная утилита. Умеет парсить тот же гугловый сервис, разбирается в устройстве разного рода zoom-виджетов но и кроме этого потребляет кастомные урлы и конфиги с описанием параметров загрузки тайлов из любого источника. Там в ридми все есть, если что.

Закончу девочкой с персиками

 22   8 дн   art   grabbing   images   tiles