Así es como Facebook enseñó a su Portal A.I.

Cuando Mark Zuckerberg construyó la primera versión de Facebook en su dormitorio universitario de Harvard, lo imaginó como una ventana que permitiría a la gente mirar las vidas de otros usuarios.

 Si Google era un motor de búsqueda de información, Facebook, por el contrario, era un motor de búsqueda de personas. Quince años después, Facebook ha llevado esta ambición al siguiente nivel.
Con la creación de Portal y Portal+, su línea de altavoces inteligentes con pantalla mejorada, lanzada en noviembre de 2018, el gigante de los medios sociales ha establecido una ventana mucho más literal, permitiendo a los usuarios de Facebook hacer videollamadas entre sí.

Visión de 140 grados

Los oradores inteligentes del Portal también literalizan otro sueño de Facebook. Donde Facebook era, en esencia, un motor de búsqueda de personas, Portal realmente las busca: con una cámara móvil de 12 megapíxeles, con un campo de visión de 140 grados, que te sigue por toda la habitación para ver lo que estás haciendo. Como dice Digital Trends en nuestra reseña, "si estás ocupado moviéndote por la cocina mientras le preguntas a la abuela cómo hacer sus famosas albóndigas, puedes mantenerte ocupado mientras escuchas su charla".
¿Cuál es exactamente la tecnología inteligente que impulsa a Portal? ¿Y cómo cree Facebook que se ha superado el reto de hacer que el videochat regular se sienta tan personal como sentarse a conversar de verdad? La respuesta implica una inteligencia artificial impresionante y un toque humano añadido.

Hacer que las cámaras sean más inteligentes

Desde el principio, Facebook supo que el núcleo de su experiencia en el Portal sería el sistema llamado "Smart Camera". La idea de la cámara inteligente era ir más allá del tipo de toma estática que servicios como Skype nos han estado ofreciendo durante años, y desempeñar un papel más creativo en el proceso. Así como un director de cine o un director de fotografía sabe cuándo emplear una toma amplia o cuándo acercarse para un primer plano íntimo, Facebook retó a sus ingenieros a imitar esta misma habilidad con Portal.


Todas las decisiones de movimiento y edición

Para dar a esta cámara el toque humano necesario, Facebook trabajó con los cineastas para encontrar la mejor manera de destilar su sabiduría en ideas aprendibles por máquina. En un caso, les pidió que demostraran cómo podían filmar una escena en la que era imposible capturar toda la información relevante desde un ángulo fijo. Portal está formado por un objetivo gran angular en el que todas las decisiones de movimiento y edición se toman de forma totalmente digital.


Los ingenieros de Facebook

En otro, los ingenieros de Facebook analizaron los diferentes elementos fotográficos que los operadores de cámara priorizan en las tomas de retratos y paisajes. Estas observaciones formaron la base de los modelos de software que intentan imbuir a Portal de algunas de las peculiaridades de la toma de decisiones que normalmente atribuiríamos a la creatividad humana.


Decisiones diseñadas para mejorar el flujo de una conversación

"Queríamos crear una experiencia de videollamadas con manos libres que eliminara la sensación de distancia física y que fuera más bien como estar juntos", explicó a Digital Trends Eric Hwang, uno de los ingenieros de Portal.
El sistema resultante -que Facebook dice que tomó "menos de dos años" para crear desde cero- permite a Portal tomar decisiones diseñadas para mejorar el flujo de una conversación. En un nuevo artículo publicado en el blog, detalla algunas de las ilustraciones de por qué esto podría ser necesario. Por ejemplo, si se encuentra en una habitación llena de gente interactuando entre sí, debe elegir cuándo seguir a un individuo fuera del encuadre o cuándo alejarse para acomodar nuevos sujetos.


Situaciones de luz cambiantes en tiempo real

Del mismo modo, debe aprender a enfrentarse a situaciones de luz cambiantes en tiempo real. ¿Qué hacer si el sujeto está acostado en una habitación oscura, medio cubierto por una manta, pero hay niños corriendo en el fondo causando desenfoque de movimiento? Portal pesa toda esta información en menos de un abrir y cerrar de ojos y trata de determinar el mejor resultado. (Si desea controlar manualmente en quién se centra, ahora también es posible).

 

No hay comentarios.:

Publicar un comentario