202510 Review: Esta industria realmente cambia tan rápido que no se puede seguir
El informe señala que debido al aumento creciente de los costos, la ambigüedad del valor comercial y la insuficiente gestión de riesgos, según la predicción de Gartner, más del 40% de los proyectos de agentic AI (agentic AI, nombre de nueva empresa) se cancelarán para finales de 2027, incluso si se mantienen los aproximadamente 60% restantes, su tasa de éxito en las tareas solo se ubicará entre el 30% y el 35%. El agentic AI se refiere a la conexión mediante módulos de machine learning de diversas aplicaciones y API para automatizar procesos oficiales, como la búsqueda y análisis de contenido exagerado en correos electrónicos. El artículo señala que, aunque este concepto haya generado imaginación en obras de ciencia ficción, como la orden "Tea, Earl Grey, hot" pronunciada por el Capitán Picard en Star Trek: The Next Generation, en la realidad estas tecnologías aún no alcanzan la eficiencia ideal y presentan riesgos de seguridad y privacidad.
Para evaluar el desempeño real del agentic AI, los investigadores de la Universidad Carnegie Mellon (CMU) establecieron la plataforma de prueba TheAgentCompany, diseñada para evaluar la capacidad de los agentes de IA en tareas como navegación web, escritura de código, operación de aplicaciones y comunicación interna. Los resultados de la prueba mostraron que el mejor modelo, Gemini-2.5-Pro, solo alcanzó un éxito del 30.3% en tareas completas, mientras que otros modelos presentaron desempeños aún más desfavorables, revelando defectos como la incapacidad para manejar ventanas emergentes y errores en la transmisión de mensajes. Por otro lado, el equipo de Salesforce, en su plataforma de prueba CRMArena-Pro para gestión de relaciones con clientes (CRM), indicó que incluso los agentes de los modelos de lenguaje de larga distancia (LLM) líderes alcanzan un éxito del 58% en una sola conversación, pero solo del 35% en interacciones múltiples, y que todos los modelos carecen generalmente de la capacidad de protección de datos confidenciales, incrementando aún más los riesgos de seguridad corporativa.
Además, el informe revela que muchos productos nuevos en el mercado que afirman poseer inteligencia agente en realidad son solo reempaquetamientos de asistentes tradicionales de IA, automatización de procesos mediante robots (RPA) o chatbots, y que solo una minoría de proveedores ofrece verdaderamente la capacidad de agente. Aunque Gartner espera que para 2028 aproximadamente el 15% de las decisiones diarias de trabajo se automatice mediante agentes de IA y que el 33% de los productos de software empresarial incluya esta tecnología, los logros actuales aún no satisfacen las demandas complejas de los negocios, y algunas áreas de aplicación (como el procesamiento de correos electrónicos) son más propensas a generar consecuencias graves debido a errores.
En las discusiones, desarrolladores e individuos de la industria tienen opiniones divergentes sobre el futuro del agentic AI. Algunos críticos sugieren que los avances actuales podrían estar señalando la saturación de plataformas o la entrada de una era de "colaboración humano-máquina" (human in the loop), y que en realidad el agentic AI no difiere esencialmente de las herramientas de automatización existentes; otros opiniones defienden que construir la tecnología de agente desde la perspectiva de bibliotecas (library) en lugar de marcos (framework) permitiría mantener flexibilidad y componibilidad al mismo tiempo que garantice resultados predictibles. Algunos comentarios también mencionan que, aunque el agentic AI puede mejorar ligeramente la eficiencia en ciertas aplicaciones, aún requiere importantes avances tecnológicos en términos de velocidad, longitud del contexto y costos para satisfacer realmente las necesidades prácticas de automatización en oficinas.
https://news.ycombinator.com/item?id=44412349