13 мегапикселей распознавать с нормальной частотой это нужен неплохой такой сервер, набитый процами и видюхами. Но я не знаю задачи, там всякие хитрости применяются обычно для увеличения производительности. Вам бы этот алгоритм на PC вначале реализовать
Комментарии: 7
Another
в медиапроцах распознавание из коробки запускается
Firelander
кодирование-декодирование возможно. Но чтобы прям распознавание
Another
распознавание лиц точно), даже если нет, то можно на телефоне делать
Dmytro
Исходников приложений камеры с распознавалкой лиц не видел, но что-то мне подсказывает, что никто там не анализирует все 13 мегапикселей (кому нужно лицо размером 1/50 высоты кадра), а алгоритм поиска лиц работает по кадру размером намного меньше, около 0,3...1 мегапикселя, который получили в результате масштабирования из 13.
Another
все не настолько очевидно, как может оказаться, у процессора должна быть определенная пропускная способность (можно посчитать исходя из мегапикселей, частоты кадров и битности ргб). У камер до 5 мп параллельный интерфейс передачи пикселей, а у камер >5мп — последовательный. Чтобы проанализировать фотографию ее нужно получить, она должна попать в процессор, потому херней тут не обойтись. Меня не волнует на данном этапе само распознавание, а только выбор процессора под такую задачу.
Dmytro
Скорость считывания кадров с камеры в RAM и скорость программной обработки массива пикселей в памяти - разные вещи. Аппаратного ускорения для поиска и распознавания в процессорах пока нет, в отличии от интерфейсов и кодирования фото/видео. Помощь процессору будет только от блока SIMD. Если надо распознавать объекты в реальном времени, вам нужно сначала написать программу распознавания для ПК, скормить ей пример видео и посмотреть, сколько ей понадобилось ресурсов. В зависимости от того, что вы будете искать в кадре и как программно реализуете, станут ясны требования к вычислительной части (именно она отвечает за распознавание, апаратная поддержка интерфейсов камер - совсем другое). Вы не выберете адекватно процессор для приложения реального времени без знания требуемых ресурсов. Поиск одних объектов на видео одного размера можно реализовать относительно просто и хватит ядра ARM Cortex-A9 на 1 ГГц, а для отслеживания других в большом кадре и на ядре настольного Core i7 реального времени не добиться.
Another
я пишу о других вещах, мне не принципиально делать распознавание на этом железе (а если и делать, то не принципиально в реальном времени, мы "распознаем" некую вещь на фото и считаем просто сколько раз это распознали и отдаем пользователю число, не больше), но очень принципиально иметь возможность получить изображение с определенной частотой. Скажем так, на VoCore они добились только 2fps ~1.5mpx