Histórico programador MVP de Microsoft se enfrenta a la IA programando en Python: “Es falso o engañoso”

La inteligencia artificial ha sido puesta a prueba por uno de los desarrolladores más importantes de la compañía fabricante de Windows. El resultado ha sido inesperado.
Algunos especialistas han asegurado que Phyton en la IA podría ser reemplazado por Java, mientras esto sucede, cada vez hay más programadores que se están rindiendo ante esta tecnología y es que generar código en ChatGPT y otras herramientas se ha vuelto muy tentador.
Los profesionales están comenzando a emplear estas apps en lenguajes de programación de todo tipo y uno de los expertos de Microsoft que lleva más de 30 años en TI, ha decidido probar qué tan confiable y potente puede llegar a hacer la inteligencia artificial.
GitHub Copilot y Amazon CodeWhisperer son unas de las opciones, pero el desarrollador veterano ha optado por usar Qwen2.5-Coder en su informe. La idea principal de hacer todo esto es determinar si la IA puede sustituir a los programadores humanos.
El resultado podría impresionar a muchos que se encuentran en la misma incertidumbre sobre los empleos del futuro, pues su conclusión podría ser la clave para entender cómo funcionan y de qué son capaces estos chatbots.
Brien Posey pone a prueba la capacidad de la IA en sus proyectos de Phyton

Los editores de código ahora tienen compatibilidad con plataformas de IA, las cuales actúan en tiempo real para ofrecer la ventaja de generar contenido que se puede acoplar a trabajos con JavaScript, C##, Java, Ruby, Rust y muchos más.
Uno de los más usados es Phyton, siendo el que cuenta con una mayor estabilidad con este tipo de programas. Pues bien, en un artículo de TechTarget, Brien Posey ha redactado paso a paso cómo es que le ha dado una oportunidad a estas herramientas.
El mencionado programador ha sido “22 veces MVP de Microsoft y candidato a astronauta comercial”. Con una experiencia de más de tres décadas trabajando en TI, es más que suficiente como para ser una fuente confiable de opinión sobre el tema controversial de la IA en el área laboral, al igual que Bill Gates y Elon Musk.
Según lo que menciona, estuvo haciendo pruebas con ChatGPT y Copilot, pero ha decidido extenderle la mano a Qwen2.5-Coder (32B) porque tiene menos limitaciones, es más asequible y cuenta con una funcionalidad de tiempo de trabajo.
“La razón principal por la que decidí usar qwen2.5-coder es que, al usarlo con la opción --verbose, puede indicar exactamente cuánto tiempo tardó en completarse el trabajo. Esto es útil porque uno de mis objetivos es cuantificar el tiempo que tarda la IA en escribir código”. - Brien Posey.
Para comenzar, ha puesto como objetivo en las evaluaciones crear un “programa basado en una interfaz gráfica de usuario”, ya que no es tan sencillo como un “Hola Mundo!” de puro texto, pero tampoco un proceso complicado.
La primera pueda es sobre PowerShell y ha determinado que el resultado fue bastante similar al que él había hecho con anterioridad. Sin embargo, hay varias cosas que no lo terminan de convencer, como que se emplean elementos distintos, hay comentarios y alteraciones en el nombre de las variables.
Después, ha continuado con la misma estrategia, pero en Phyton, un lenguaje de programación del que tiene conocimientos básicos. Hacer un código sencillo le ha tomado 19 minutos y 33 segundos, mientras que la IA hizo algo similar en 14 segundos, lo cual es “70 veces más rápido”.
“He tenido experiencias diversas con esas herramientas. A veces, hicieron un trabajo excelente, mientras que otras veces, produjeron código que ni siquiera se acercaba a la corrección. Esto suele ocurrir cuando las herramientas de IA alucinan, lo que significa que su resultado es falso o engañoso, pero se presenta como correcto”.
Considerando que los resultados han sido sumamente veloces y con una estructuración similar a la que él ha realizado, parece que son herramientas aptas en ciertos casos, pero habría que ver qué tan bien se comportan en proyectos más grandes.
El experto ha aprovechado para explicar que su experiencia ha sido regular porque, en algunas situaciones, la inteligencia artificial otorga respuestas sin sentido, lo cual da lugar a las temidas alucinaciones del modelo.
Solo por eso, hace que sea una opción engañosa, ya que a veces podría ser correcta y otras no, a pesar de que el chatbot lo asegure. No obstante, afirma que suele emplear ChatGPT y Copilot en trabajos complejos.
Posey cree que si esta tecnología es usada para complementar el código, no debería haber problema, pero cuando se trata de reemplazar por completo a un programador, no es confiable porque no cuenta con la misma precisión y razonamiento que un humano.