Дополненная реальность станет скучной, но это хорошо

13.11.2017

Именно сейчас, как никогда прежде, дополненная реальность стала активно вклиниваться в нашу повседневную жизнь. Пока всё это носит, по большей части, лишь развлекательный характер: создаются стикеры и маски в социальных сетях, игры, использующие окружающую действительность в качестве основной площадки действий и т.д. Один из авторов влиятельного ресурса Medium Баррон Вебстер (Barron Webster) считает, что так будет не всегда: настанет момент, когда AR-приложения станут меньше развлекать нас и приносить больше пользы. 


В последнее время многие люди пребывают в восторге от чего-либо с названием AR или «Augmented Reality» («дополненная реальность»): в Twitter есть множество примеров работы подобных приложений, Facebook запустил платформу элементов оформления на основе AR, Google и Apple представили собственные инструменты разработки контента с дополненной реальностью (AR Core и ARKit соответственно), а последняя даже показала потрясающую игру на этой технологии во время презентации iPhone X. 

Большинство интересных примеров работы AR, которые мы видим сегодня, заключается в наложении объектов, персонажей, фильтров или других эффектов на мир вокруг нас. В основном это делается через камеру смартфона, но в некоторых случаях, и с помощью дополнительных девайсов (как Hololens и Magic Leap).


Такие примеры хоть и забавны, но весьма условны, так как они показывают что-то невозможное. В реальной жизни вы не можете увидеть Марио, рассекающего на картинг-болиде по улице или хот-дог, танцующий прямо на столе. Этот тип дополненной реальности, который можно назвать «добавочной AR», основан на фотографических и кинематографических традициях, — и не только потому, что большинство из нас знакомится с AR-контентом через просмотр записанных демок, но и по той причине, что мы воспринимаем камеру так же, как 100 лет назад.

Мы всё ещё думаем о камере, как о способе записи медиа. Первые камеры фотографировали, подвергая химические вещества воздействию света; затем они научились снимать фильмы; позднее — цифровые фотографии и видео, которые продолжают улучшаться с каждым днём. Их функция заключалась в том, чтобы записывать окружающую действительность, и на этом всё ограничивалось.


«Добавочная AR» — это следующий шаг в усовершенствовании фото и видео, заключающийся в цветовых и поляризационных светофильтрах, субтитрах, компьютерной графике, распознавании лиц для воздействия с ними (например, для наложения масок в Snapchat). Дополненная реальность позволяет сжать весь сложный производственный цикл CGI-графики до её генерации прямо в реальном времени после нажатия одной единственной кнопки.

С вашей точки зрения, смартфон производит весь AR-контент, используя лишь камеру, — это одна из причин, по которой «добавочная AR» кажется интуитивно понятной технологией. Получается кратчайший цикл обратной связи: камера «видит» объект, а смартфон налету накладывает на него графику и мгновенно показывает вам результат.

В дополнение к этому, процентная доля всех устройств, которые умеют записывать фото или видео, резко возросла за последнее десятилетие. Причиной тому стали компании, создавшие популярные и очень простые в использовании платформы потребления визуального контента: Facebook, Instagram, Snapchat, YouTube и прочие, которые подхватили эту идею в связи с тем, что экраны и камеры стало всё дешевле производить. Неудивительно, что ежегодно люди делают больше и больше фотографий, а техногиганты считают, что пора «повернуться» в сторону видео.

Всё это — весьма безопасная ставка вышеупомянутых компаний на то, что вы будете продолжать фотографировать и снимать видео и в будущем. Добавление AR-фильтров, стикеров и прочих украшательств к уже существующим (фильтрам Instagram, стикерам Snapchat и т.д.) — наиболее беспроблемный способ приучить вас пользоваться AR. Тем более, что это можно делать на девайсах, которые вы уже используете.

У меня есть предчувствие, что существуют хоть и менее захватывающие или красочные, но гораздо более полезные в реальной жизни AR-приложения. Вместо того, чтобы AR просто стал следующим шагом в фотографии, мы могли бы подумать об AR, как о следующем шаге в вычислительных платформах. Дополненная реальность может стать самым быстрым способом внедрения вычислений в мир вокруг нас (в данном контексте под «вычислениями» я подразумеваю выполнение каких-либо операций, требующих подключение к интернету, без необходимости его использовать — например, делиться фотографиями через океан за миллисекунду или автоматически исправлять текстовые опечатки).

Массовое внедрение технологий дополненной реальности стало возможно благодаря тому, что камеры научились  распознавать окружающее пространство. На базовом уровне они способны определить положение пола, стен и углов, на более сложном — понять, на какую книгу, обувь или автомобиль они смотрят. Несложно представить себе будущее, где камера сможет определять большинство товаров, мест и даже ситуаций.


Давайте отвлечёмся от того, какую графику добавляет AR на изображение, захваченного камерой, а сосредоточимся непосредственно на самом изображении. То есть обратим внимание не на поле из Minecraft, наложенное поверх стола, а на сам стол.

Вам не нужна дополненная реальность, чтобы понять, что стол — это стол, но крутость того, что ваша камера «знает», что такое стол, заключается в том, что это вообще мало связано непосредственно с камерой: стол теперь имеет доступ в Сеть, а камера выступает просто посредником между интернет-данными и столом (или книгой, или диваном — неважно). Фото или видео, получившееся во время «связи стола со внешним миром», — лишь второстепенный артефакт. Ведь даже физическое постукивание по этому самому столу гораздо больше относится к распознаванию его искусственным интеллектом для отработки AR, чем просто процесс его съёмки на камеру (как бы странно ни звучало).

Итак, что же происходит, когда стол, книга или гостиная, получает доступ к вычислениям? Почему это интересно? Что происходит, когда вы направляете камеру (или в будущем, кто знает, волшебную палочку) на объекты, места или ситуации? Я недостаточно умён, чтобы предсказать это, но можно посмотреть на другие категории девайсов, которые в какой-то момент получили доступ к Сети. Когда динамики подключились к интернету, они начали говорить с нами, слушать нас, и советовать, во сколько нужно выезжать на работу. Когда это случилось с автомобилями (Uber) — целая транспортная отрасль была преобразована в течение нескольких лет. С домами (Airbnb) — появилась возможность путешествовать в любую точку мира и быть уверенным в наличии места для проживания. Ну а когда наши друзья повалили в Сеть (Instagram, Facebook), наше общение радикально поменялось (подростки, ведь, больше не выходят на улицу, верно?).

После подключения вашего стола к сети, быть может, он научится сам заказывать ужин при наведении камеры на него или сможет сравнивать себя с другими столами, или автоматически выкладывать объявление о своей продаже. Указывая смартфоном на духовку или лампу, возможно, вы получите доступ ко всей возможной информации и действиям, подходящим под данную ситуацию: «Можно ли приготовить желаемое блюдо в этой печи?», «Сколько бы я сэкономил, если бы поменял лампочки?». Дополненная реальность — это ближайшая вообразимая технология, способная приносить пользу (и не только пользу, иначе было бы слишком скучно), основываясь на информации, собираемой из окружающей действительности.

Несколько разработчиков уже экспериментируют с моделью «распознавание — вычисление — результат». Magic Sudoku от Брэда Дуайера (Brad Dwyer) — приложение, распознающее указанную вами головоломку Судоку и разгадывает её в конкретном контексте. Джуди Аморрес (Judith Amores) и Анна Фусте (Anna Fusté) разработали игру Paper Cubes, которая использует определённые вещи в пространстве в качестве маркеров для бегающих в виртуальном пространстве маленьких человечков.


Есть одна большая проблема в работе принципа «распознавание — вычисление — результат» в широких масштабах. По большей части способ создания компьютерных программ состоит в том, что для каждой новой категории вещей, с которыми они работают (слова/буквы, песни, фотографии, люди), разработчики вручную прописывают все действия и информацию, которые можно производить с этими категориями. Когда мы стали загружать фотографии на компьютеры, разработчики придумали фоторедакторы. Когда телефоны с помощью GPS научились определять своё местоположение, появились картографические приложения и навигаторы. 

Но если камеры станут лучше распознавать объекты, мы сможем работать с ними гораздо быстрее, чем с компьютерами. Возможно ли запрограммировать приложения на распознавание совершенно любых категорий объектов, которые только могут попасть в объектив камеры смартфона? Даже если это так, вы бы не хотели загружать по одному приложению на каждую категорию.

Чтобы AR работала как широкая вычислительная платформа, а не просто куча классных отдельных приложений, нужно правильно выстроить множество элементов. Самым сложным из них является правильное распознавание контекста ситуации. Вам точно не захочется искать разные AR-приложения для каждой конкретной ситуации, в которой вы находитесь, потому что их тысячи, и вы также не сможете узнать, есть ли вообще AR-приложение именно под ту ситуацию, которая вам нужна. А вот то, чего бы вы действительно желали, так это возможность получать своевременные подсказки от смартфона о том, как лучше поступить в тех обстоятельствах, на которые вы указали камерой. Итак, что ваш гаджет должен «знать», чтобы иметь возможность делать это?

1. Распознавание объектов. Ваш смартфон должен знать, на кого/что он смотрит. За последние несколько лет в этом направлении были достигнуты значительные успехи, и крупные игроки постоянно пытаются улучшить эту функцию.

2. Ваше местоположение. Ваш смартфон должен знать, в какой точке мира вы находитесь.

3. Ближайшие места вокруг. Ваш смартфон должен знать, где вы находитесь относительно ближайших объектов вокруг, чтобы эта информация распространялась всем, кто с ними взаимодействует.

4. Ваши желания. Предсказание того, чего вы хотите или что вам необходимо в конкретный момент времени должно сузиться от «вам, наверное, сейчас чего-нибудь бы хотелось» до вполне конкретного «вы, вероятно, хотели бы поехать на велосипеде по этой улице, так как обычно передвигаетесь именно на нём». 

Преодолев технические препятствия, сможет ли AR стать полезной вычислительной платформой? Что будет, если позволить людям «вычислять» мир вокруг них? Не знаю. Но современные приложения круто развиваются в данном направлении. 

Нам потребовалось добрые 5 лет, чтобы понять, что GPS в сочетании с камерой образует действительно отличные сервисы для знакомств. Если телефоны смогут взаимодействовать с окружающим миром, какие ещё возможности можно себе представить? Что будет, когда дополненная реальность станет просто ещё одним скучным способом использования компьютера? Не знаю, но для меня это гораздо интереснее, чем добавлять танцевальные хот-доги к моим фотографиям.

Мнение Big Geek

Итак, автор статьи пророчит дополненной реальности куда менее весёлое, но гораздо более полезное применение, чем сейчас. Думаю, это хорошо, ведь, значительно лучше ежедневно пользоваться интеллектуальным компаньоном, упрощающим жизнь, чем 1-2 раза поприкалываться с новыми «масочками» в очередной соцсети, не так ли? В конце концов, и они никуда не денутся, просто новых будет появляться меньше.

Ну а вы согласны с основными тезисами статьи? Верите ли в светлое и полезное AR-будущее или считаете, что технология — лишь бесполезная игрушка? Обязательно делитесь своим мнением!

Иван Кудинов, Big Geek
По материалам: Medium