Adept quiere construir una IA que pueda automatizar cualquier proceso de software – TechCrunch

En 2016, varios de los desarrolladores originales detrás de lo que se convirtió en Siri, en TechCrunch Disrupt New York, presentaron Viv, una plataforma de inteligencia artificial que prometía conectar varias aplicaciones de terceros para realizar casi cualquier tarea. El lanzamiento fue seductor, pero nunca se realizó por completo. Más tarde, Samsung adquirió Viv e incorporó una versión simplificada de la tecnología a su asistente de voz Bixby.

Seis años después, un nuevo equipo afirma haber descifrado el código de un asistente de IA universal, o al menos haberse acercado un poco más. En un laboratorio de productos llamado Adept que surgió hoy de la clandestinidad con $ 65 millones en fondos, están, en palabras de los fundadores, “construidos[ing] inteligencia general que permite a los humanos y las computadoras colaborar creativamente para resolver problemas”.

Son cosas elevadas. Pero los cofundadores de Adept, el CEO David Luan, el CTO Niki Parmar y el científico en jefe Ashish Vaswani, tienen como objetivo perfeccionar una superposición dentro de las computadoras que funcione con las mismas herramientas que los humanos. Esta superposición podrá responder a comandos como “generar un informe de cumplimiento mensual” o “dibujar una escalera entre estos dos puntos en este plano”, dice Adept, todo usando software existente como Airtable, Photoshop, Tableau y Twilio para obtener la trabajo hecho. .

†[W]Estamos entrenando una red neuronal para usar cualquier herramienta de software en el mundo, aprovechando la amplia gama de capacidades existentes que los humanos ya han creado”. Luan le dijo a TechCrunch en una entrevista por correo electrónico. †[W]Con Adept, puedes concentrarte en el trabajo que más disfrutas y nuestro [system] para asumir otras tareas… Esperamos que el empleado sea un buen estudiante y altamente capacitado, más útil y en sintonía con cada interacción humana”.

Según la descripción de Luan, lo que crea Adept es un poco como la automatización robótica de procesos (RPA), o robots de software que usan una combinación de automatización, visión por computadora y aprendizaje automático para automatizar tareas repetitivas como el envío de formularios y la respuesta por correo electrónico. Pero el equipo insiste en que su tecnología es mucho más avanzada que la que ofrecen actualmente los proveedores de RPA como Automation Anywhere y UiPath.

“Estamos construyendo un sistema común que ayuda a las personas a hacer las cosas detrás de sus computadoras: un trabajador de IA universal para cualquier trabajador del conocimiento… Entrenamos una red neuronal para usar todas las herramientas de software del mundo, aprovechando la gran cantidad de capacidades existentes que las personas Ya lo he hecho.” He creado,” dijo Luan. “Creemos que la capacidad de la IA para leer y escribir texto seguirá siendo valiosa, pero poder hacer cosas en una computadora será significativamente más valioso para las empresas… [M]Los odels entrenados en texto pueden escribir una gran prosa, pero no pueden realizar acciones en el mundo digital. no puedes preguntar [them] para reservarle un vuelo, escribir un cheque a un vendedor o realizar un experimento científico. La verdadera inteligencia general requiere modelos que no solo puedan leer y escribir, sino que también actúen cuando las personas les pidan que hagan algo”.

Adept no es el único que explora esta idea. En un artículo de febrero, los científicos de DeepMind, respaldado por Alphabet, describen lo que ellos llaman un enfoque “basado en datos” para enseñar a la IA a controlar computadoras. Al hacer que una IA observe los comandos del teclado y el mouse de los humanos que realizan tareas informáticas de “seguimiento de instrucciones”, como reservar un vuelo, los científicos pudieron mostrar al sistema cómo el sistema puede realizar más de cien tareas con precisión “humana”.

No por casualidad, el cofundador de DeepMind, Mustafa Suleyman, se asoció recientemente con el cofundador de LinkedIn, Reid Hoffman, para lanzar Inflection AI, que, al igual que Adept, tiene como objetivo utilizar la IA para ayudar a las personas a trabajar de manera más eficiente con las computadoras.

El diferenciador aparente de Adept es una confianza de investigadores de inteligencia artificial provenientes de DeepMind, Google y OpenAI. Vaswani y Parmar ayudaron a ser pioneros en Transformer, una arquitectura de IA que ha recibido mucha atención en los últimos años. Desde 2017, Transformer se ha convertido en la arquitectura preferida para tareas de lenguaje natural, demostrando una aptitud para resumir documentos, traducir entre idiomas e incluso clasificar imágenes y analizar secuencias biológicas.

Entre otros productos, el GPT-3 generador de lenguaje de OpenAI se desarrolló utilizando la tecnología Transformer.

“Durante los siguientes años, todos se subieron al Transformer y lo usaron para resolver problemas de hace décadas en una rápida sucesión. Cuando dirigí ingeniería en OpenAI, escalamos el Transformador a GPT-2 (el predecesor de GPT-3) y GPT-3”, dice Luan. “Los esfuerzos de Google para escalar los modelos de Transformer han valido la pena [the AI architecture] BERT, la fuerza impulsora detrás de la Búsqueda de Google. Y varios equipos, incluidos nuestros fundadores, han capacitado a Transformers para escribir código. DeepMind incluso demostró que el Transformador funciona para el plegamiento de proteínas (AlphaFold) y Starcraft (AlphaStar). Los transformadores hicieron tangible la inteligencia general para nuestro campo”.

En Google, Luan fue el líder tecnológico general de lo que él describe como el “gran esfuerzo modelo” en Google Brain, una de las divisiones de investigación más importantes del gigante tecnológico. Allí, entrenó a Transformers cada vez más grandes con el objetivo de construir eventualmente un modelo común para todos los casos de uso de aprendizaje automático, pero su equipo se topó con una limitación obvia. Los mejores resultados se limitaron a modelos diseñados para sobresalir en dominios específicos, como analizar registros médicos o responder preguntas sobre temas específicos.

“Desde el comienzo del campo, queríamos construir modelos con la misma flexibilidad que los modelos de inteligencia humana que pueden funcionar para una amplia variedad de tareas… [M]El aprendizaje automático ha progresado más en los últimos cinco años que en los 60 anteriores “, dijo Luan. “Históricamente, el trabajo de IA a largo plazo ha sido competencia de las grandes empresas de tecnología, y su concentración de talento y potencia informática ha sido inexpugnable. Creemos que la próxima era de avances en IA requerirá resolver problemas en el corazón de la colaboración entre humanos y computadoras”.

Cualquiera que sea la forma que adopte su producto y modelo de negocio, ¿puede Adept tener éxito donde otros han fracasado? Si es posible, la ganancia inesperada podría ser significativa. Según Markets and Markets, el mercado de las tecnologías de automatización de procesos comerciales (tecnologías que agilizan las cargas de trabajo administrativas y de atención al cliente de la empresa) crecerá de $ 9.8 mil millones en 2020 a $ 19.6 mil millones en 2026. Una encuesta de 2020 realizada por el proveedor de automatización de procesos Camunda ( una fuente sesgada, sin duda) encontró que el 84% de las organizaciones anticipan una mayor inversión en la automatización de procesos como resultado de las presiones de la industria, incluido el aumento del trabajo remoto.

“La tecnología de Adept suena plausible en teoría, [but] hablar de que los Transformers ‘tienen que ser capaces de actuar’ me parece un poco engañoso”, dijo Mike Cook, un investigador de inteligencia artificial del colectivo de investigación Knives & Paintbrushes, que no está afiliado a Adept, a TechCrunch por correo electrónico. . “Los transformadores están diseñados para predecir los siguientes elementos de una serie de cosas, eso es todo. No le importa a un Transformador si esa predicción es una letra en un texto, un píxel en una imagen o una llamada a la API en una pieza de código. Por lo tanto, no parece más probable que esta innovación conduzca a la inteligencia artificial general que a cualquier otra cosa, pero podría ofrecer una IA más adecuada para ayudar con tareas simples”.

Es cierto que el costo de entrenar sistemas avanzados de IA es más bajo que nunca. Con una fracción de la financiación de OpenAI, las nuevas empresas, incluidas AI21 Labs y Cohere, han podido construir modelos comparables en capacidades a GPT-3.

Mientras tanto, las innovaciones en curso en la IA multimodal (IA que puede comprender las relaciones entre imágenes, texto y más) proporcionan un sistema que puede traducir las solicitudes en una amplia variedad de comandos informáticos dentro de su rango de capacidades. Lo mismo ocurre con InstructGPT de OpenAI, una técnica que mejora la capacidad de los modelos de lenguaje como GPT-3 para seguir instrucciones.

La principal preocupación de Cook es cómo Adept ha entrenado sus sistemas de inteligencia artificial. Señala que una de las razones por las que otros modelos de Transformer han tenido tanto éxito con el texto es que hay una plétora de ejemplos de texto para aprender. Un producto como el de Adept presumiblemente requeriría muchos ejemplos de tareas completadas con éxito en aplicaciones (por ejemplo, Photoshop) combinados con descripciones de texto, pero esta información no es tan natural en el mundo.

En el estudio DeepMind de febrero, los científicos escribieron que para recopilar datos de entrenamiento para su sistema, tenían que pagar a 77 personas para que completaran más de 2,4 millones de demostraciones de tareas informáticas.

†[T]Los datos de entrenamiento probablemente se crearon artificialmente, lo que genera muchas preguntas, tanto sobre a quién se le pagó para crearlos, qué tan escalable es esto a otras áreas en el futuro y si el sistema entrenado tendrá el tipo de profundidad que otros modelos de Transformer. tener”, dijo Cook. “Ser – estar [also] no es un ‘camino a la inteligencia general’ de ninguna manera… Podría hacerlo más capaz en algunas áreas, pero probablemente será menos capaz que un sistema entrenado explícitamente en una tarea y aplicación en particular.

Incluso las hojas de ruta mejor diseñadas pueden encontrarse con desafíos técnicos imprevistos, especialmente cuando se trata de IA. Pero Luan confía en el talento senior de Adept, incluido el exlíder de la infraestructura de fabricación de modelos de Google (Kelsey Schroeder) y uno de los ingenieros originales del modelo de reconocimiento de voz de fabricación de Google (Anmol Gulati).

†[W]Si bien la inteligencia general a menudo se describe en el contexto del reemplazo humano, esa no es nuestra estrella polar. En cambio, creemos que los sistemas de IA deben construirse con las personas en el centro “, dijo Luan. “Queremos brindarles a todos acceso a herramientas de IA cada vez más sofisticadas que les permitan trabajar con la herramienta para lograr sus objetivos. Nuestros modelos están diseñados para trabajar de la mano con las personas Nuestra visión es que las personas permanezcan en el asiento del conductor: descubrir nuevas soluciones, tomar decisiones mejor informadas y darnos más tiempo para el trabajo que realmente queremos hacer”.

Greylock y Addition codirigieron la ronda de financiación de Adept. La ronda también contó con la participación de Root Ventures y ángeles, incluido el fundador de Behance, Scott Belsky (fundador de Behance), el fundador de Airtable, Howie Liu, Chris Re, el líder de Tesla Autopilot, Andrej Karpathy y Sarah Meyohas.

Leave a Comment