Голосовой ассистент и очки HoloLens помогут слабовидящим перемещаться

13 декабря 2018

Голосовой ассистент и очки HoloLens помогут слабовидящим перемещаться

Американские ученые разработали технологию CARA на базе очков дополненной реальности Microsoft HoloLens, которая поможет слабовидящим людям ориентироваться в пространстве. Каждый предмет в окружении получит свой “голос”, благодаря чему человек будет…

Американские ученые разработали технологию CARA на базе очков дополненной реальности Microsoft HoloLens, которая поможет слабовидящим людям ориентироваться в пространстве. Каждый предмет в окружении получит свой “голос”, благодаря чему человек будет понимать, что находится вокруг него. Технология позволит обходить препятствия, осуществлять навигацию в зданиях и на улице, формировать пространственную память.

Как работает устройство

С помощью очков HoloLens, устройство сканирует все поверхности и предметы, используя видео- и инфракрасные датчикию. Программа обнаруживает поверхности объектов с точностью до сантиметра и создает трехмерную карту окружающего пространства. Затем Cognitive Augmented Reality Assistant (CARA) конвертирует информацию, полученную из датчиков HoloLens, в аудиосообщения, придавая каждому объекту «голос», который человек слышит с помощью гарнитуры.

Чем ближе человек находится к объекту, тем выше тон голосового помощника. Пользователь взаимодействует с устройством в трех режимах, используя голосовые команды и кликер:

  • Режим«прожектора». Ассистент называет объект, на который направлен взгляд пользователя.
  • Режим сканирования. Ассистент называет слева направо все объекты, которые видит камера HoloLens.
  • Целевой режим. Подается информация только об одном объекте, если человеку нужно найти его или пройти рядом.

В тестировании технологии участвовали 7 человек с нарушениями зрения. Они использовали HoloLens, чтобы добраться в офис команды на втором этаже. Всем участникам удалось добраться до офиса с первого раза.

По данным ВОЗ, 1,3 миллиарда человек во всем мире живут с разными формами нарушения зрения: 217 миллионов людей попадают в категорию слабовидящих, а 36 миллионов — полностью слепых. Технология Caltech демонстрирует многообещающие результаты и может применяться в различных разработках для помощи людям с нарушениями зрения. В дальнейшем ученые собираются тестировать, как HoloLens и CARA работают в общественных местах с большим скоплением людей — в торговых центрах, магазинах, парках развлечений.

Поездка на беспилотном такси Waymo One — первые впечатления

13 декабря 2018
waymo

Поездка на беспилотном такси Waymo One — первые впечатления

В начале декабря Waymo запустили первый коммерческий сервис такси без водителей. Поездки пока доступны 400 людям — участникам Early Riders — программы тестирования беспилотных автомобилей Waymo One, которая работает с…

В начале декабря Waymo запустили первый коммерческий сервис такси без водителей. Поездки пока доступны 400 людям — участникам Early Riders — программы тестирования беспилотных автомобилей Waymo One, которая работает с апреля 2017. Редактор сайта The Verge Эндрю Хокинс одним из первых совершил несколько платных поездок и рассказал о своих впечатлениях.

Поездки

Нажимая на кнопки встроенного в спинку сидения экрана, пассажиры Waymo One могут начать поездку, обратиться в техподдержку, снять блокировку дверей — пишет Эндрю. На время коммерческого тестирования за рулем для безопасности все еще будет сидеть водитель, чтобы избежать инцедентов, подобных тому, что произошел на тестах Uber в мае 2018.

Журналист совершил три поездки на автомобиле Waymo и отметил, что качество движения улучшилось со временем. «Раньше казалось, что тебя везет подслеповатая бабушка. Теперь поездка ощущается в основном нормально». Автомобиль замедляется перед лежачими полицейскими, ускоряется, если нужно перестроиться, умеет совершать ряд сложных маневров, например, левые повороты. Несколько раз машина останавливалась, слегка заехав на пешеходный переход, после чего сдавала назад — Энди назвал это одним из самых удивительных моментов в поездке.

Посмотрите видео-отчет о поездке, выпущенный The Verge:

«Это похоже на поездку в Диснейленд», — сказал Диего Вера, участник программы Early Riders. Он так же отметил, что со временем машины стали двигаться более уверенно, почти как человек — ускоряться в определенные моменты, начинать ехать на желтый свет светофора.

Алекс Хоффман, инженер по кибербезопасности из Mesa, отметил, что автомобиль Waymo 3 раза «запутался» из-за большого куста возле офиса. «Я писал отзывы о поездке каждый раз, и в четвертый раз машина обошла его без проблем», — сказал Хоффман в интервью, опубликованном Waymo .

Площадь покрытия Waymo One сейчас составляет 250 км на территории Финикса и окрестностей. Всего автомобили проехали 16 миллионов километров по реальным дорогам с городским движением и 11 миллиардов в виртуальном симуляторе.

Приложение

Приложение похоже на минималистичную версию приложения Uber. После выбора маршрута программа рассчитывает стоимость поездки. Иногда на карте может отображаться сине-зеленая буква «W», указывающая на более доступное место для посадки или высадки. Пассажирам нужно немного пройтись, чтобы машинам Waymo было легче их найти. В приложении можно оценить качество поездки от 1 до 5 и оставить отзыв. Также можно моментально связаться со службой поддержки через чат или по телефону. Приложение будет доступно на iOS и Android и появится в сторах, когда компания откроет Waymo для широкого круга пользователей.

Приложение Waymo One

Сколько будет стоить поездка?

Учитывая огромную конкуренцию между Uber и Luft и низкую стоимость поездок, скорее всего поездки на Waymo тоже будут не слишком дорогими. За восьмиминутную поездку на расстояние 5 км журналист заплатил $7, что сопоставимо с ценой Uber и Lyft. Представители компании говорят, что стоимость поездки будет варьироваться в зависимости от спроса и расстояния.

Что дальше?

Не смотря на то, что Waymo первыми запустили автономный сервис такси, до реальных поездок обычных людей еще далеко. География сервиса ограничена небольшой территорией и водители, которые присутствуют в кабине демонстрируют, что проект пока еще на стадии тестирования. Однако компания имеет амбициозные планы.  

Waymo планирует приобрести 62 000 минивэнов Chrysler Pacifica и 20 000 электрических внедорожников Jaguar I-Pace, чтобы построить свой парк в течение следующих нескольких лет и расширять территорию покрытия в США. Недавно сервис получил разрешение на эксплуатацию автомобилей без водителя в Силиконовой долине и провел свою первую встречу с жителями города.

Составлена интерактивная карта компаний-разработчиков ИИ в России

12 декабря 2018

Составлена интерактивная карта компаний-разработчиков ИИ в России

Аналитическая компания «АйПи Лаборатория» представила интерактивную карту искусственного интеллекта России. На карте обозначены 323 компании, которые занимаются разработками в области ИИ, разделенные по сферам деятельности. Можно посмотреть географию, выручку, динамику роста…

Аналитическая компания «АйПи Лаборатория» представила интерактивную карту искусственного интеллекта России. На карте обозначены 323 компании, которые занимаются разработками в области ИИ, разделенные по сферам деятельности. Можно посмотреть географию, выручку, динамику роста рынка и т.д.

На главной странице карты отображаются все компании из списка. При наведении на название компании появляется краткая информация о ней и ссылки на сайт. Размеры кругов с названиями пропорциональны объему выручки. Также компании объединены в кластеры, которые отображаются по аналогии со строением мозга человека. Например, компании, которые занимаются разработкой технологий компьютерного зрения, показаны в области зрительной коры. 

Отдельные страницы карты отображают информацию о динамике роста компаний в каждом сегменте с 2000 по 2017 год и динамику общей выручки. Вкладка «каталог» содержит классификацию компаний по областям деятельности.

Сферы использования ИИ

На графике выше показаны сферы, в которых компании чаще всего используют ИИ. Чаще всего компании в России применяют ИИ для бизнес-аналитики — 54 компании. На втором месте компьютерное зрение — 48 компаний. Также одними из самых частых сфер применения являются здравоохранение и создание систем обработки естественного языка — 40 компаний в каждой сфере.

Карта построена на открытых данных. Подробнее о методике построения и классификации можно прочесть на сайте.

Географическое распределение компаний по России. Самый большой круг — Москва, второй по величине — Санкт-Петербург

В следующую версию карты будут включены университеты, научные учреждения, публикации и патенты. Как и в первой версии, часть информации будет открыта, а часть доступна только для участников открытой конференции по искусственному интеллекту OpenTalks.AI.

Европейский союз — лидер по количеству научных публикаций в сфере ИИ, но Китай догоняет

12 декабря 2018

Европейский союз — лидер по количеству научных публикаций в сфере ИИ, но Китай догоняет

“Китай обгонит Европу по количеству публикаций исследовательских работ в сфере искусственного интеллекта в течение следующих четырех лет, если текущие тенденции сохранятся” — говорится в отчете аналитической компании Elsevier, опубликованном в…

“Китай обгонит Европу по количеству публикаций исследовательских работ в сфере искусственного интеллекта в течение следующих четырех лет, если текущие тенденции сохранятся” — говорится в отчете аналитической компании Elsevier, опубликованном в начале декабря. Согласно докладу, Европа — лидер в области научных исследований об ИИ на 2018 год. Индия занимает третье место по объему научных исследований в области ИИ после США и Китая. Германия и Япония занимают пятое и шестое место.

В дополнение к растущему количеству исследований от Baidu и Tencent, в Китае находятся некоторые из наиболее успешных стартапов. Например, в начале декабря появились новости о том, что Megvii — материнская компания Face ++ , планирует привлечь дополнительные 500 миллионов долларов при оценке в 3,5 миллиарда долларов. «Китай стремится к глобальному лидерству в с сфере искусственного интеллекта и поддерживается амбициозной национальной политикой», — говорится в отчете.

Топ стран по количеству публикаций. Данные за август 2018. Китай - 134 990, США - 106 600, Индия - 36 736, Великобритания - 35 302, Япония - 28 124
Топ стран по количеству публикаций. Данные за август 2018. Китай — 134 990, США — 106 600, Индия — 36 736, Великобритания — 35 302, Япония — 28 124

Самые растущие области — NLP и Computer vision

Несмотря на общее количество опубликованных работ, китайские исследования не так часто цитируют, и эта тенденция может быть признаком регионального, а не глобального охвата, говорится в докладе. «Китайские исследования сосредоточены на компьютерном зрении. Исследования в области обработки естественного языка и распознавания речи не так развиты, возможно, потому что проводятся корпорациями, которые публикуют не так много научных статей».

Число публикаций в разных областях ИИ
Число публикаций в разных областях ИИ

В глобальном масштабе количество опубликованных научных работ по искусственному интеллекту за последние пять лет увеличилось на 12,9%, количество препринтов ArXiv по NLP и компьютерному зрению выросло на 37%.

В ежегодном отчете о состоянии европейских технологий, опубликованном в прошлом году венчурной компанией Atomico, содержится призыв к расширению связей между технологическим сектором региона и исследовательскими институтами, чтобы конкурировать с Китаем и США.

Стартап кастомизирует косметику по уходу за кожей с помощью машинного обучения

11 декабря 2018
средства по уходу за кожей

Стартап кастомизирует косметику по уходу за кожей с помощью машинного обучения

Стартап Proven Skincare использует машинное обучение, чтобы определить, какие ингредиенты средств по уходу за кожей будут лучше работать на людях из разных стран, живущих в разном климате. Клиенты, которые хотят заказать…

Стартап Proven Skincare использует машинное обучение, чтобы определить, какие ингредиенты средств по уходу за кожей будут лучше работать на людях из разных стран, живущих в разном климате.

Клиенты, которые хотят заказать косметику в Proven Skincare, предоставляют данные — возраст, этническую принадлежность, адрес, образ жизни и проблемы кожи, которые нужно решить. На основе данных о месте проживания анализируется состояние окружающей среды, количество ультрафиолета, жесткость воды и другие особенности, которые влияют на состояние кожи — всего 27 факторов. Доступ к геолокации также позволяет исследователям корректировать составы продуктов в зависимости от сезонных погодных изменений.

Полученную информацию сравнивают с базой Skin Genome, созданной на основе данных 4000 исследований и 8 миллионов отзывов потребителей о косметических продуктах. Программа выбирает, какие ингредиенты из 20 000 в базе данных подойдут конкретному клиенту с его потребностями. Например, одни кислоты подходят для работы с гиперпигментацией на афро-американской и азиатской коже с высоким содержанием меланина, а другие лучше работают на светлой и чувствительной.

«По мере того, как наши клиенты и мы сами тестируем и используем продукты и делимся этими знаниями с базой данных, программа подбора работает точнее и лучше» — говорят основатели стартапа.

В кафе Alibaba появились роботы-официанты для уборки посуды

11 декабря 2018

В кафе Alibaba появились роботы-официанты для уборки посуды

При супермаркетах Alibaba открыты роботизированные кафе Robot.He. Процесс выбора столика, заказа и получения еды в кафе полностью автоматизирован с 2016 года. Теперь в ресторанах появились роботы для уборки посуды. А…

При супермаркетах Alibaba открыты роботизированные кафе Robot.He. Процесс выбора столика, заказа и получения еды в кафе полностью автоматизирован с 2016 года. Теперь в ресторанах появились роботы для уборки посуды. А работники кафе выполняют только ту работу, с которой роботы пока не справляются — готовят еду. 

C помощью сенсорного экрана посетители выбирают столик с нужным расположением и количеством мест, сканируя QR-код в приложении для смартфона. Затем в супермаркете можно выбрать продукты, которые сотрудник кассы передаст роботизированной руке. Она отправляет продукты на кухню. После того как блюдо будет готово, робот по специальной ленте доставит блюдо прямо к столику. 

Роботы версии 2.0, выпущенные в 2018 году, научились самостоятельно заряжаться — при низком заряде батареи они подъезжают к зарядной станции и также самостоятельно возвращаются к работе после подзарядки. Кроме того, в кафе появились роботы, которых можно вызвать для уборки грязной посуды. Забрав тарелки, они отвозят их в кухню для мытья.

Как только роботы научатся готовить еду, роботизированное кафе превратится в полностью автономный конвейер или фабрику-кухню, о которой мечтали идеологи социализма в 20-30е годы в СССР.

Alibaba открывает кафе в своих гипермаркетах и магазинах в Китае с января 2016 года, к концу 2018 их будет более 100.

Посмотрите, как работает кафе:

VR позволяет школьникам изучать последствия сотрясения мозга

10 декабря 2018
VR сотрясение мозга

VR позволяет школьникам изучать последствия сотрясения мозга

По данным American Medical Asscociation каждый пятый спортсмен старшей школы получает сотрясение мозга. В штате Арканзас запустили новую интерактивную образовательную программу, которая использует VR технологии, чтобы помочь школьникам понять, какие…

По данным American Medical Asscociation каждый пятый спортсмен старшей школы получает сотрясение мозга. В штате Арканзас запустили новую интерактивную образовательную программу, которая использует VR технологии, чтобы помочь школьникам понять, какие риски и последствия несет в себе сотрясение.

Программа CrashCourse

VR компонент программы состоит из интерактивного фильма. Зрители оказываются на поле во время футбольного матча. В определенные моменты фильма им нужно выбрать, что делать дальше, после чего показываются последствия действий. В создании видео приняли участие футбольные игроки из Стэнфрда, которые рассказывают о рисках сотрясения мозга и о том, как его избежать.

Вторая часть программы называется Symptoms Simulator. Пользователь может на себе “ощутить” симптомы сотрясения. Это сделано для того, чтобы в дальнейшем школьники смогли обнаруживать признаки сотрясения самостоятельно. Кроме того, с помощью CrashCourse можно изучить 3D-сканы человеческого мозга до и после сотрясения, чтобы лучше понимать разницу в состояниях.

Программа открыта для бесплатного использования, но Арканзас первым применил её в таком широком масштабе — CrashCourse появится во всех средних школах штата.

Тест: Сможете распознать фейковые фото, созданные GAN?

10 декабря 2018
gan фейковые фотографии

Тест: Сможете распознать фейковые фото, созданные GAN?

В 2014 году Ян Гудфеллоу представил идею генеративно-состязательных сетей или GAN. Они называются «генеративными», потому что получают на выходе изображения, а «состязательными» — потому что представляют собой две сети, конкурирующие…

В 2014 году Ян Гудфеллоу представил идею генеративно-состязательных сетей или GAN. Они называются «генеративными», потому что получают на выходе изображения, а «состязательными» — потому что представляют собой две сети, конкурирующие друг с другом. Первая старается обмануть вторую, создавая примеры фото, а вторая пытается отличить настоящие изображения от поддельных. 

К 2017 году GAN уже научились создавать убедительные фейки, которые трудно отличить от реальных фото. Подобные технологии могут применяться в рекламе и видеоиграх, но также могут стать инструментом дезинформации.

Тест

Сначала попробуйте самостоятельно распознать фальшивые фото с помощью этого теста. После этого возвращайтесь к чтению статьи.

фейковые фото DCGAN 2014
Фото, созданные DCGAN в 2014

Как видите, в 2014 GAN создавали изображения, которые легко отличить от реальных фотографий.

На изображении ниже примеры лиц, сгенерированных нейросетью в 2017:

фейковые фото twin-gan
Реалистичные фото знаменитостей, сделанные с помощью PGAN в 2017

Узнать, настоящий ли человек на фото можно обратив внимание на ряд деталей. Фотографии, созданные нейросетью, отличаются небольшими артефактами. Примеры будут приведены именно с лицами, потому что на лицах лучше видны изменения. Эти же артефакты помогут распознать и другие виды фейковых изображений.

Волосы выглядят размазанными или окрашенными

Такой артефакт характерен для длинных волос. Большая часть выглядит одинаково, но одна или несколько прядей не полностью прямые и выбиваются из общей картины — как будто волосы немного размазаны или покрашены большой кистью.

Непонятный текст

фейковые фото созданные нейросетью

GAN, которые обучаются созданию лиц, испытывают трудности с созданием текста на фоне. Сети тренируются на двух версиях фото — оригинальной и зеркальной. Поэтому созданный текст может быть отображен в другую сторону.

Сюрреалистичный фон

фейковые фотографии людей gan

Данные для обучения GAN центрируются, чтобы лица выглядели правдоподобно, например, чтобы глаза и уши находились на своих местах. Фон, в свою очередь, может содержать что угодно, поэтому GAN просто генерирует “фоноподобные” текстуры.

Ассиметрия

как отличить реальные фото от фейковых сгенерированных нейросетью

Сеть может испытывать трудности с созданием одинаковых объектов, если они расположены  на достаточно большом расстоянии, как серьги. Не смотря на то что в обучающих датасетах серьги обычно парные, на фальшивых фото они чаще разной длины.

Также стоит обратить внимание на глаза. На реальных фотографиях они смотрят в одном направлении и, в большинстве случаев, имеют одинаковый цвет. На многих фото, созданных GAN, глаза могут смотреть в разные точки и быть гетерохромными.

Уши тоже могут быть разного размера и не совпадать по высоте.

Зубы

зубы на фейковых фото

GAN может генерировать смещенные зубы, зубы неправильных размеров и пропорций. Похожая проблема возникает при работе с повторяющимися деталями, например, при синтезе текстуры с кирпичами.

Растрепанные волосы

волосы на фейковых фотографиях gan

Быстрый способ идентифицировать сгенерированное GAN изображение. Сеть собирает волосы в пучки, создает случайные пучки вокруг головы и на лбу. Работа с волосами — одна из самых сложных для GAN, потому что прически имеют много вариаций и деталей.

Смешивание гендеров

ошибки gan на фотографиях

Эта GAN была обучена на датасете CelebA , который  содержит 200 000 изображений лиц 10 000 знаменитостей. В наборе данных не было примеров людей одновременно с волосами на лице, косметикой и серьгами, но GAN может смешивать подобные признаки.

Шум

артефакты на фотографиях GANНекоторые монохромные области демонстрируют непостоянный шум с горизонтальными или вертикальными полосами. В приведенных выше случаях сеть пытается имитировать текстуру ткани. Старые GAN чаще создают искажения в виде шахматной доски.

Переливы цвета

переливы цвета ganОбласти светлых цветов — одежда, воротники, шея, белки глаз, могут иметь цветные радужные переливы.

Примеры реальных изображений людей

реальные фото людей

Теперь посмотрите фото с реальными людьми. Обратите внимание на фон, симметрию, прически. Можно снова пройти тест и посмотреть, насколько уменьшилось количество ошибок.

Инструменты, которые позволят автоматизировать проверку фейкового контента, уже в разработке. Американские исследователи создали алгоритм, который распознаёт видео с фейками c 99% точностью, анализируя частоту морганий, а нейросеть от Adobe разоблачает поддельные фотографии, автоматически выявляя обработанные и измененные части изображения.

Стартап создает устройство для управления компьютером силой мысли

7 декабря 2018
ctrl kit

Стартап создает устройство для управления компьютером силой мысли

Стартап из Нью-Йорка разрабатывает устройство, способное переводить электрические импульсы мозга в цифровые сигналы. Технология называется Ctrl-kit и позволяет управлять компьютером силой мысли. Разработку показали на мероприятии для стартапов SLUSH, которое…

Стартап из Нью-Йорка разрабатывает устройство, способное переводить электрические импульсы мозга в цифровые сигналы. Технология называется Ctrl-kit и позволяет управлять компьютером силой мысли. Разработку показали на мероприятии для стартапов SLUSH, которое проходило в Хельсинки на этой неделе.

«С помощью Ctrl-kit вы становитесь контроллером. Система извлекает значение ваших движений, принимая на вход сигналы биологических нейронов и передают их, преобразуя в импульсы вычислительных нейронов. Таким образом люди управляют вычислительными нейронами с помощью собственных», — сказал исполнительный директор Ctrl-labs Томас Рирдон.

Ctrl-kit выглядит как большие часы — его можно надеть и закрепить на запястье. Программное обеспечение основано на WebSockets со встроенными скриптами JavaScript и TypeScript. В данный момент Ctrl-kit работает вместе с компьютером, но конечная цель — создать гибкую и совместимую со многими устройствами систему.

Посмотрите видео, опубликованное VentureBeat c примером того, как работает контроллер:

Ctrl-kit работает независимо от движения мышц 

Ctrl-Labs использует дифференциальную электромиографию (EMG), чтобы превратить умственное намерение в действие. Устройство регистрирует изменения электрического потенциала импульсов, движущихся от мозга к мышцам рук. Шестнадцать электродов постоянно контролируют сигналы двигательных нейронов, усиленных сигналами мышечных волокон. Алгоритм машинного обучения, построенный на TensorFlow, различает индивидуальные импульсы каждого нерва. Однако все ещё сложнее, чем кажется на первый взгляд — система работает независимо от движения мышц, получая чистые мозговые сигналы от двигательных нейронов.

Компания собирается выпустить версию устройства для разработчиков в первом квартале 2019 года. Ctrl-Labs видят большой потенциал для применения своей технологии прежде всего в видеоиграх, дополненной и виртуальной реальности.