Чтобы беспилотный автомобиль безопасно передвигался по дороге, система в автомобиле собирает данные с камер, лидаров и радаров. Ситуации, с которыми автомобиль сталкивается в реальности и в симуляции, используются для обучения моделей для автономного вождения. Чтобы расширить данные для обучения с минимальными затратами на сбор дополнительных данных и человеческую разметку, исследователи используют техники аугментации данных.
Расширение датасета новыми данными
Аугментация данных позволяет увеличить количество объектов данных и их разнообразие без дополнительных затрат на сбор и разметку. Основная идея за аугментацией — это применить набор операций над объектом в выборке, чтобы трансформировать начальный объект. В случае с картинками примерами действий являются отражение, обрезка, поворот и изменение цвета. Такие простые трансформации позволяют получить получить из одного объекта данных множество. При этом подбор и применение операций для трансформаций требует значительных затрат на ручной подбор параметров.
Метод аугментации для облаков точек с лидаров
Пространство поиска для облаков точек включает в себя 8 операций для аугментации:
- Добавление объекта;
- Изменение угла;
- Масштабирование;
- Добавление шума от передвижения;
- Фильтрация части точек в облаке;
- Замена части точек в облаке на шум;
- Случайный поворот;
- Случайная фильтрация части точек
Каждое действие имеет вероятность применения этого действия и набор специфичных параметров. Чтобы автоматизировать процесс поиска политик аугментации для облаков точек, исследователи предлагают алгоритм Progressive Population Based Augmentation (PPBA). PPBA основан на алгоритме Population Based Training (PBT). Модель использует эволюционный алгоритм, который схож с теорией естественного отбора Дарвина, чтобы выучить оптимальные параметры аугментации. Лучшие параметры из предыдущих итераций используются как основа для мутации параметров в следующих итерациях.
На открытом датасете Waymo использование PPBA для аугментации позволяет повысить скор модели (3D mAP). Кроме того, PPBA работает быстрее, чем базовый алгоритм PBA и случайный поиск.