ChatGPT

modelo de linguaxe optimizado para o dialogo

ChatGPT é un prototipo de chatbot de intelixencia artificial centrado na usabilidade e o diálogo. Desenvolvido por OpenAI, o chatbot usa un modelo de linguaxe adestrado mediante a aprendizaxe automática por reforzo e baseado na arquitectura GPT-3.5. [1]

ChatGPT
Logo
Tipoprotótipo, Inteligência artificial generativa, software privativo, IA conversacional, Modelo de linguaxe de grande escala e chatterbot
Data de fundación30 de novembro de 2022
Nomeado en referencia achat e GPT-1
Na rede
https://chat.openai.com/ e https://chatgpt.com/
IMDB: nm14636917 Twitter: ChatGPTapp Musicbrainz: d6971d63-2dc1-40b0-8e2d-ded6f3319f70 Editar o valor em Wikidata
editar datos en Wikidata ]

Características editar

Introducido o 30 de novembro de 2022, ChatGPT chamou a atención pola súa facilidade de uso e destacou polas súas respostas detalladas e o seu coñecemento histórico. O formato de diálogo permite a ChatGPT responder preguntas de seguimento, admitir os seus erros, desafiar premisas incorrectas e rexeitar solicitudes inadecuadas.[2] O chatbot é capaz de xerar todo tipo de textos, dende poesía ata diálogos. Non obstante, a pesar da ampla gama de sinais aos que é capaz de reaccionar, a súa imperfecta precisión fáctica recibiu algunhas críticas.

ChatGPT adestrouse mediante a aprendizaxe de reforzo a partir de adestramento supervisado, un método que aumenta a aprendizaxe automática con entradas humanas para lograr un resultado realista.[3] Está baseado na arquitectura GPT-3.[4] Durante o proceso de adestramento, os supervisores humanos desempeñaron o papel de usuarios e asistentes de IA. O modelo foi adestrado na infraestrutura de supercomputación de Microsoft Azure e axustouse mediante algoritmos de optimización de políticas próximas.[5] Os algoritmos de optimización de políticas proximais presentan un beneficio rendible ao depender de algoritmos de optimización de políticas rexionais e negan moitas das operacións computacionalmente custosas cun rendemento máis rápido.[6][7]

Comparado co seu predecesor InstructGPT, ChatGPT intenta reducir as respostas nocivas e enganosas. Os datos de adestramento de ChatGPT inclúen documentos da aplicación Man, unha ferramenta de sistemas Unix, e coñecemento de fenómenos de Internet como o sistema de taboleiros de anuncios e a linguaxe de programación Python.[8]

 
Sam Altman, cofundador e CEO de OpenAI até novembro de 2023.

A diferenza da maioría dos chatbots, ChatGPT ten estado e lembra conversas anteriores coas indicacións que recibiu, o que pode permitir que ChatGPT se use como terapeuta personalizado.[9] Nun esforzo para evitar que se produzan resultados ofensivos, en ChatGPT, as consultas fíltranse a través dunha API de moderación que rexeita as referencias potencialmente racistas ou sexistas. [10] [9]

ChatGPT ten varias limitacións. O modelo de recompensa de ChatGPT, deseñado en torno á supervisión humana, pódese optimizar en exceso e, polo tanto, dificultar o rendemento, tamén coñecido como Lei de Goodhart.[11] Durante a formación, os revisores preferiron respostas máis longas, independentemente da comprensión real ou do contido real.[2] Os datos de adestramento tamén poden sufrir un nesgo algorítmico e as indicacións que inclúen descriptores vagos de persoas, como por exemplo un CEO, poderían xerar unha resposta que asuma que esa persoa é un varón branco.[12]

Limitacións editar

A pesar da súa capacidade de comprensión e rapidez para responder preguntas e xerar textos, o chatbot ten certas limitacións e o seu software pode ter problemas para procesar a información dada se é demasiado complexa. Por outra banda, tampouco é capaz de tratar con toda precisión e detalle conceptos ou acontecementos demasiado recentes, xa que a inxesta de coñecemento detívose no 2021. Ademais, ChatGPT está deseñado para non permitir preguntas inadecuadas nin solicitudes perigosas. [13]

Preocupacións éticas editar

A relación entre a intelixencia artificial e a ética é un tema que está de actualidade e provoca certas preocupacións. As empresas tecnolóxicas que ofrecen programas como este son conscientes de certos límites que non se poden traspasar.

No caso de ChatGPT, o sistema pode recoller prexuízos e opinións xerais de Internet de forma que en ocasións, dependendo da solicitude do usuario, chegue a crear bromas ou vaia guiarse por estereotipos sobre determinados personaxes. Así mesmo, tamén ten acceso a noticias falsas e teorías de conspiración que poden interferir con que os datos proporcionados polo chatbot non sexan totalmente veraces. Unha das outras restricións programadas por OpenAI son avisos a preguntas concretas: se se lle pregunta como intimidar a alguén responderá que o acoso é malo, así como se se lle pregunta sobre manipular persoas ou construír armas perigosas.[13]

Notas editar

  1. "ChatGPT FAQ". help.openai.com (en inglés). Consultado o 16/01/2023. 
  2. 2,0 2,1 OpenAI (30/11/2022). "ChatGPT: Optimizing Language Models for Dialogue" (en inglés). Consultado o 16/01/2023. 
  3. Knox, W. Bradley; Stone, Peter. "Augmenting Reinforcement Learning with Human Feedback" (PDF) (en inglés). Consultado o 16/01/2023. 
  4. Ahmed, Zohaib (2/12/2022). "What is ChatGPT, the AI chatbot everyone’s talking about". The Indian Express (en inglés). Consultado o 16/01/2023. 
  5. "ChatGPT: Optimizing Language Models for Dialogue" (en inglés). 30/11/2022. Consultado o 16/01/2023. 
  6. Gao, Leo; Schulman, John; Hilton, Jacob (19/10/2022). "Scaling Laws for Reward Model Overoptimization" (PDF). Cornell University (en inglés). Consultado o 16/01/2023. 
  7. Wouter, van Heeswijk (29/11/2022). "Proximal Policy Optimization (PPO) Explained". Towards Data Science (en inglés). Consultado o 16/01/2023. 
  8. Edwards, Benj (5/12/2022). "No Linux? No problem. Just get AI to hallucinate it for you". Ars Technica (en inglés). Consultado o 16/01/2023. 
  9. 9,0 9,1 Roose, Kevin (5/12/2022). "The Brilliance and Weirdness of ChatGPT". The New York Times (en inglés). Consultado o 16/01/2023. 
  10. ChatGPT OpenAI (30/11/2022). "Optimizing Language Models for Dialogue" (en inglés). Consultado o 16/01/2023. 
  11. Gao, Leo; Schulman, John; Hilton, Jacob (19/10/2022). "Scaling Laws for Reward Model Overoptimization" (PDF). arXiv:2210.10760 [cs, stat] (en inglés). Consultado o 16/01/2023. 
  12. Kelly, Samantha Murphy (5/12/2022). "This AI chatbot is dominating social media with its frighteningly good essays". CNN Business (en inglés). Consultado o 16/01/2023. 
  13. 13,0 13,1 BBC Science Focus Magazine, ed. (8/12/2022). "ChatGPT: Everything you need to know about OpenAI's GPT-3 tool". Science Focus (en inglés). Consultado o 16/01/2023. 

Véxase tamén editar