A los asistentes de voz como Siri de Apple o Google Voice les falta muchísimo para ser perfectos. Quizás por eso han surgido multitud de apps que intentan mejorar lo presente. Sherpa es una de ellas y probablemente la más popular en Android: ha logrado más de 650.000 descargas y 1,6 millones de dólares de financiación. Su creador, Xabier Uribe-Etxebarria, charló ayer con los lectores de Gizmodo en Español en uno de nuestros webchats. Debajo, las preguntas y respuestas más interesantes.

MadMan2: ¿En qué falla Siri y en qué es Sherpa mejor?

Xabier: el módulo de información en Sherpa es mucho más potente. Prueba un simple: ¿Quién es Obama? Siri no es capaz de responder. Nosotros tenemos integraciones con servicios transaccionales como Paypal, tickets para conciertos, billetes de avión, etc. El módulo proactivo que lanzaremos en breve marcará la diferencia, ya que Sherpa no esperará a que el usuario le pregunte sino que se anticipará a sus necesidades. Además, hemos trabajado el español con diferentes dialectos de Latinoamérica: Chile, Argentina, Venezuela, México, Colombia... Todo ello teniendo en cuenta que Sherpa tiene que funcionar en diferentes dispositivos de diferentes marcas, diferentes pantallas, etc lo que hace más difícil el desarrollo.

Advertisement

Crinos05: ¿Has comenzado a crear ya una versión de Sherpa sobre Google Glass? ¿Qué te parecen las gafas de realidad aumentada?

Xabier: el tema de las gafas, y en general los wearable devices (relojes, pulseras, etc), está en auge. Todos necesitan una interfaz y en el caso de las gafas la voz es fundamental, por eso estamos trabajando en una versión de Sherpa con un fabricante de este tipo de hardware de realidad aumentada. De todas formas, creo que tienen todavía muchos obstáculos que superar, como la privacidad, la batería, etc.

Fragache: ¿Puede Sherpa interactuar en dos idiomas al mismo tiempo?

Xabier: es algo que tenemos pendiente todos los sistemas de este tipo. Estamos trabajando para mejorar eso, aunque ya puedes cambiar el idioma automáticamente en Sherpa diciendo frases como: "cambia el idioma a inglés" o "inglés" a secas.

Santi3: ¿Cómo funciona la tecnología de Sherpa?

Xabier: es un híbrido. No utilizamos Wolfram Alpha como Siri, sino un sistema propio de acceso y devolución de información generalista que hemos bautizado como MultiKnowledge System. Hay otras fuentes que son pagadas como la información de resultados deportivos, etc

Advertisement

Angel Jiménez: ¿El reconocimiento de voz lo realizáis con una solución propia o usáis servicios de Nuance o similares?

Xabier: al igual que Siri y otros sistemas similares, nos centramos en el Procesamiento de Lenguaje Natural, sistema de diálogo y, en nuestro caso, gestión de APIs, usuarios y sistema proactivo. La parte de reconocimiento de voz la hacemos con sistemas de compañías que se dedican solo a eso, como la que comentas.

Ferlondon: ¿Cómo conseguiste hacer el salto a EE.UU. tan rápido? Y, ¿cuántos idiomas hablas tú personalmente? Siendo vasco y doctor en lingüística imagino que varios.

Xabier: mi consejo es crear un gran producto antes incluso de levantar una ronda grande de financiación o de lanzarlo al mercado. Después hay que echarle ganas y atreverse a tocar la puerta de inversores, socios, o gente que pueda ser relevante para el éxito de tu producto/servicio... Estén donde estén en el mundo. Si hace falta te coges un avión sólo para ir a una conferencia donde va una persona que crees que va a ser relevante para el éxito de tu producto. Tengo que aclarar que no soy doctor en lingüística, estudié para serlo pero no lo acabé. Sólo hablo 3 idiomas: Castellano, Euskera e Inglés, y todos mal.