NY Times выпустил репортаж о деятельности фабрик по разметке данных в Китае и пришел к выводу, что Китай выйдет в лидеры в сфере машинного обучения и ИИ в ближайшие годы, обогнав США.
Научные статьи китайских учёных чаще цитируются в исследованиях, а треть всех разработок в сфере компьютерного зрения в 2017 году пришли из поднебесной. Китайское правительство поддерживает сферу ИИ финансово и политически.
США и Китай давно соревнуются в области разработки искусственного интеллекта, но у Китая есть одно неоспоримое преимущество — почти бесконечное количество дешевой рабочей силы.
В Китае собирают не меньше данных, чем в США
В Китае слабо развиты законы обеспечения конфиденциальности, правительство имеет неограниченный доступ к огромному количеству данных. Люди часто используют мобильные телефоны при оплате покупок, еды, билетов в кино, поэтому китайские интернет-компании получают больше информации. Однако данные бесполезны без предварительной обработки — их нужно разбирать и маркировать.
Фабрики разметки
«Два десятка молодых людей просматривают фотографии и видеоролики, размечая почти все, что видят. Это машина. Это светофор. Это хлеб, это молоко, это шоколад».
В стране развивается новая отрасль — стартапы, которые занимаются исключительно маркировкой данных. Фабрики открываются по всему Китаю и упрощают работу AI-компаний. Они появляются в районах, далеких от крупных городов, с невысокой оплатой труда и низкой стоимостью помещений, поэтому позволяют нанимать больше работников со всей провинции. В компании Ruijin Technology работает 300 человек, но после Нового года стартап планирует расширить число сотрудников до 1000.
Стоимость аренды фабрики размеров с две баскетбольних площадки — $21000 в год, работник-маркировщик получает от $400 до $500 в месяц. Фабрики помогают AI-компаниям получать огромное количество размеченных данных быстро и дешево. Например, стартап AInnovation получил 20 000 размеченных фотографий для разработок за 3 дня и $2000.
Эксперты называют Китай «Саудовской Аравией данных», а подобные фабрики «нефтеперерабатывающими заводами». Они превращают необработанные данные в топливо, которое поддерживает амбиции правительства сделать Китай лидером в сфере искусственного интеллекта.
В Китае существует тенденция к созданию городов-фабрик, где люди работают, едят, проводят все свободное время и даже выходят замуж. Фабрики разметки данных тоже могут вырасти в такие производства к 2030 году. Подробнее о том, как устроены города-фабрики, смотрите в фильме Discovery: