Edukov Mikhail

Search galaxy by image

Описание проекта

О чем этот проект?
Это приложение для астрономов и физиков, занимающихся астрофизикой

В чем суть проекта?
Одним из объектов изучения астрофизики являются галактики и их морфологические свойства. Часто так бывает, что непосредственно исследовать какие-то параметры не удается, но можно посмотреть на 'похожие' по некоторым свойствам галактики (в данном проекте просто структурой и формой) и рассматривать уже их. 

Как это работает?

Сначала с помощью каскадов Хаара находим галактику.

Затем изображение нормируется и подается на вход к энкодеру. Энкодер выдает вектор (embedding). Проделав такую операцию для многих галактик, получим пространство векторов размерности 48. В нем для каждого вектора можно найти ближайшие, по L2 норме например.

Примеры работы

Пример 1.

Возьмем галактику

а вот похожие на нее

Пример 2.

Пример 3.

 

Что такое энкодер?
Энкодер - это одна из двух частей автоэнкодера.

В данной задаче использовалось 4 сверточных блока (Conv->MaxPool->Elu) в энкодере и 4 блока (Conv.T -> Elu)

А откуда берутся данные?
Все изображения были взяты отсюда.

Окей, а если я не астроном, могу я как-то использовать это?

пфф, конечно..

 

Состав команды:

  • Edukov Mikhail, CEO of Research and meme creator

Комментарии

Иван Бондаренко

Интересно, насколько модель устойчива к повороту? В примерах все галактики находятся в одинаковом положении, а если одну галактику повернуть, например, на 90 градусов, она будет находить в похожих оригинал?) Может, стоит перед поиском сделать какое-то нормализующее преобразование, чтобы они все были в одном положении (или оно уже есть, но я не нашёл)?

Edukov Mikhail

Оличный вопрос. В некоторых задачах угол является важным параметром на фото и все выданные сеткой похожие галактики будут с примерно таким же углом. Есть два очевидных пути как это исправить:
1. сделать преобразования как вы сказали, но тогда требуется заново обучить сетку
2. подавать на вход сетке какое то количество аугментированных фото и выбирать из них. Этот вариант лучше, возможно он когда-нибудь реализуется.

Ivan Panin

Казалось бы, примеры в выборке стандартизированы и не нужно специально находить галактику - она в центре и занимает большую часть картинки и каскады Хаара не нужны.

Или все не так?

Edukov Mikhail

Это не совсем так. Галактика при скачивании действительно находится в центре. Каскады Хаара тут нужны скорее чтобы обрезать ненужные края изображения, т.к. размер галактик может изменяться существенно.

Pavel Mochalov

При попытке установки выводит следующее:

C:\Users\Avo1d\Downloads\similar-galaxy-master\similar-galaxy-master>pip install
-r requirements.txt
Collecting keras==2.1.6 (from -r requirements.txt (line 1))
  Using cached https://files.pythonhosted.org/packages/54/e8/eaff7a09349ae9bd40d
3ebaf028b49f5e2392c771f294910f75bb608b241/Keras-2.1.6-py2.py3-none-any.whl
Requirement already satisfied: requests in c:\users\avo1d\anaconda3\lib\site-pac
kages (from -r requirements.txt (line 2))
Collecting sklearn==0.19.0 (from -r requirements.txt (line 3))
  Could not find a version that satisfies the requirement sklearn==0.19.0 (from
-r requirements.txt (line 3)) (from versions: 0.0)
No matching distribution found for sklearn==0.19.0 (from -r requirements.txt (li
ne 3))
Михаил, подскажите, как можно с этим справится?

Edukov Mikhail

Пофиксил