«NY Times»: фабрики разметки данных сделают Китай лидером в сфере ИИ

AI china фабрики разметки данных для нейросетей

NY Times выпустил репортаж о деятельности фабрик по разметке данных в Китае и пришел к выводу, что Китай выйдет в лидеры в сфере машинного обучения и ИИ в ближайшие годы, обогнав США.

Научные статьи китайских учёных чаще цитируются в исследованиях, а треть всех разработок в сфере компьютерного зрения в 2017 году пришли из поднебесной. Китайское правительство поддерживает сферу ИИ финансово и политически.

США и Китай давно соревнуются в области разработки искусственного интеллекта, но у Китая есть одно неоспоримое преимущество — почти бесконечное количество дешевой рабочей силы.

В Китае собирают не меньше данных, чем в США

В Китае слабо развиты законы обеспечения конфиденциальности, правительство имеет неограниченный доступ к огромному количеству данных. Люди часто используют мобильные телефоны при оплате покупок, еды, билетов в кино, поэтому китайские интернет-компании получают больше информации. Однако данные бесполезны без предварительной обработки — их нужно разбирать и маркировать.

Фабрики разметки

«Два десятка молодых людей просматривают фотографии и видеоролики, размечая почти все, что видят. Это машина. Это светофор. Это хлеб, это молоко, это шоколад».

В стране развивается новая отрасль — стартапы, которые занимаются исключительно маркировкой данных. Фабрики открываются по всему Китаю и упрощают работу AI-компаний. Они появляются в районах, далеких от крупных городов, с невысокой оплатой труда и низкой стоимостью помещений, поэтому позволяют нанимать больше работников со всей провинции. В компании Ruijin Technology работает 300 человек, но после Нового года стартап планирует расширить число сотрудников до 1000.

Работники стартапа, занимающегося маркировкой данных
Работники стартапа, занимающегося маркировкой данных

Стоимость аренды фабрики размеров с две баскетбольних площадки — $21000 в год, работник-маркировщик получает от $400 до $500 в месяц. Фабрики помогают AI-компаниям получать огромное количество размеченных данных быстро и дешево. Например, стартап AInnovation получил 20 000 размеченных фотографий для разработок за 3 дня и $2000.

Эксперты называют Китай «Саудовской Аравией данных», а подобные фабрики «нефтеперерабатывающими заводами». Они превращают необработанные данные в топливо, которое поддерживает амбиции правительства сделать Китай лидером в сфере искусственного интеллекта.

В Китае существует тенденция к созданию городов-фабрик, где люди работают, едят, проводят все свободное время и даже выходят замуж. Фабрики разметки данных тоже могут вырасти в такие производства к 2030 году. Подробнее о том, как устроены города-фабрики, смотрите в фильме Discovery:

Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

gogpt