La preocupación no es infundada. El repositorio ha visto un alarmante aumento en las moderaciones y rechazos, pasando del habitual 2-3% a un 10% en un solo año. Esta escalada se atribuye directamente a una "afluencia masiva" de trabajos con "alucinaciones" de IA y errores no verificados. La Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR) de 2026 ofreció una visión aún más preocupante: el 21% de las revisiones por pares se sospechaba que eran completamente generadas por IA, y más de la mitad mostraban signos de su uso. Peor aún, aproximadamente el 1% (199 manuscritos) de los trabajos presentados a ICLR fueron totalmente generados por IA, y un 9% contenía más del 50% de texto producido por modelos. Esta realidad ha forzado a ArXiv a tomar acciones decisivas para preservar la integridad y calidad del conocimiento científico que alberga.
Cómo funciona la nueva política
La política de ArXiv no deja lugar a dudas sobre la responsabilidad del autor. La prohibición de un año se activará cuando exista "evidencia incontrovertible" de que el contenido no fue verificado adecuadamente por un ser humano. Esta evidencia puede manifestarse de diversas formas, todas indicativas de una falta de supervisión crítica. Entre los ejemplos más claros se incluyen:
- Referencias alucinadas: Citas a estudios o autores inexistentes, o atribuciones incorrectas de trabajos reales.
- Meta-comentarios de LLMs: Frases o fragmentos de texto dejados por el propio modelo de lenguaje, como "aquí hay un resumen de 200 palabras; ¿quieres que haga algún cambio?", que demuestran que el autor copió y pegó el resultado sin edición.
- Datos ficticios en tablas o pasajes: Presentación de información numérica o cualitativa que carece de base empírica o coherencia lógica.
- Pasajes generados sin comprensión humana: Secciones del texto que, al ser leídas, revelan una falta de coherencia, lógica o una comprensión superficial del tema, sugiriendo que el autor no entendió lo que el modelo generó.
Una vez impuesta la prohibición, el autor no podrá presentar nuevos trabajos a ArXiv durante un año completo. Tras este período, la readmisión no es automática. Para que sus futuras presentaciones sean consideradas, los autores baneados deberán lograr que sus trabajos sean aceptados y publicados en una "reputable peer-reviewed venue" (sede de revisión por pares de buena reputación) antes de que ArXiv las aloje. Este requisito subraya el compromiso de ArXiv con la calidad y la verificación externa, asegurando que los autores demuestren su capacidad para producir investigación verificable antes de volver a su plataforma.
Es crucial entender que ArXiv ha sido explícito: la política no prohíbe el uso de herramientas de IA como asistentes de escritura o para la generación de ideas. Lo que se sanciona es la delegación completa de la autoría y la falta de responsabilidad por el contenido final. Los autores serán plenamente responsables por cualquier aspecto del trabajo, incluyendo plagio, declaraciones sesgadas o imprecisiones fácticas, independientemente de cómo se haya generado el texto. Thomas G. Dietterich, presidente de la sección de Ciencias de la Computación de ArXiv, ha sido una voz prominente en la clarificación de esta política, enfatizando la total rendición de cuentas por parte de los investigadores.
Qué cambia para los profesionales tech
Para los ingenieros y profesionales tech, especialmente aquellos involucrados en la investigación y la publicación académica o preprints, esta nueva política de ArXiv marca un punto de inflexión. Si bien la IA generativa ofrece eficiencias notables en la redacción, el resumen o la estructuración de documentos, el mensaje es claro: la autoría intelectual y la supervisión humana son irremplazables. Esto implica una necesidad imperante de desarrollar un rigor aún mayor en la revisión y verificación de cualquier contenido asistido por IA.
Los profesionales tech deberán ser conscientes de que el simple hecho de usar una herramienta de IA para acelerar la creación de un artículo no exime de la responsabilidad total sobre su exactitud, originalidad y ética. Esto es particularmente relevante en el desarrollo de software, la creación de nuevos algoritmos o la propuesta de soluciones técnicas, donde la precisión de los datos y la validez de los argumentos son fundamentales. La política de ArXiv se alinea con una tendencia más amplia en la publicación académica; un estudio de PNAS de febrero de 2026, que analizó más de 5.2 millones de artículos en 5,114 revistas, reveló que, si bien el 70% de las revistas tienen políticas sobre el uso de IA, solo el 0.1% (76 de 75,000 artículos recientes) mencionan explícitamente su uso. Esta brecha indica que ArXiv está actuando de forma proactiva para establecer un estándar más claro.
Además, la barrera del idioma inglés, que para muchos investigadores no anglófonos representa un desafío considerable, ha convertido a la IA en una herramienta atractiva para la redacción. Sin embargo, esta conveniencia no puede traducirse en una delegación total. Los profesionales tech deben invertir en la comprensión profunda de las limitaciones de los LLMs, como su propensión a la "alucinación", y en técnicas de verificación rigurosa para asegurar que su contribución sea genuinamente humana y científicamente sólida. La prohibición de un año en ArXiv puede tener un impacto significativo en la carrera de un investigador, especialmente para aquellos en etapas tempranas que dependen de los preprints para establecer su presencia en la comunidad científica. Como señaló Joy Buchanan, una prohibición de un año podría, en la práctica, sentirse como una "prohibición de por vida" para los "working papers" en el ecosistema de preprints.
Qué viene después
La implementación de esta política por parte de ArXiv abre un nuevo capítulo en la interacción entre la inteligencia artificial y la producción de conocimiento científico, y sin duda generará debates y evoluciones. El principal desafío será la efectividad de la detección de contenido generado por IA y la interpretación de la "evidencia incontrovertible". A medida que los modelos de IA se vuelven más sofisticados, también lo harán las herramientas y metodologías para identificar su huella, creando una carrera armamentista tecnológica entre la generación y la detección.
Las reacciones de la comunidad científica son variadas. Expertos como Lucas Beyer, ex-investigador de OpenAI y ahora en Meta, han calificado la política de "muy buena", abogando por una "fuerte aplicación". Sin embargo, Paul Ginsparg, el creador de ArXiv, ha expresado su preocupación sobre la capacidad de la IA para eludir las barreras de calidad, sugiriendo una lucha continua. La preocupación por una posible dependencia excesiva de herramientas de detección automática, y el riesgo de desalentar el uso legítimo de la IA para la asistencia en la escritura científica, son puntos importantes en el debate.
Es probable que otros repositorios y revistas académicas sigan el ejemplo de ArXiv, desarrollando sus propias directrices y sistemas de verificación. Este escenario requerirá que las instituciones académicas y los organismos de investigación refuercen la formación ética y técnica de sus investigadores. Como ha destacado Rafael Sampaio de la UFPR en Brasil, es crucial capacitar a los investigadores sobre las limitaciones de las herramientas de IA y que los organismos nacionales establezcan directrices éticas claras.
En el ámbito regulatorio, varios países latinoamericanos, como Colombia y Costa Rica, ya están desarrollando hojas de ruta o leyes con énfasis ético en la IA. La Ley de IA de la Unión Europea ya ha influido en proyectos regulatorios en países como Brasil y Chile. Sin embargo, aún queda un camino por recorrer; un estudio de marzo de 2026 en México encontró que el 47% de las revistas científicas carecen de pautas específicas sobre IA, mientras que el 9% la prohíbe y el 44% la permite con restricciones. Esta disparidad resalta la necesidad de una estandarización y una educación continua sobre el uso responsable de la IA en la investigación a nivel global y regional.