{"id":17467,"date":"2026-04-13T16:24:48","date_gmt":"2026-04-13T19:24:48","guid":{"rendered":"https:\/\/fenati.org.br\/?p=17467"},"modified":"2026-04-14T12:09:30","modified_gmt":"2026-04-14T15:09:30","slug":"emocoes-comportamento-inteligencias-artificiais","status":"publish","type":"post","link":"https:\/\/fenati.org.br\/en\/emocoes-comportamento-inteligencias-artificiais\/","title":{"rendered":"Como emo\u00e7\u00f5es simuladas afetam o comportamento de intelig\u00eancias artificiais"},"content":{"rendered":"<p><strong>Intelig\u00eancias artificiais &#8211;<\/strong> Um estudo publicado em 2 de abril de 2026 pela <a href=\"https:\/\/pt.wikipedia.org\/wiki\/Anthropic\" target=\"_blank\" rel=\"noopener nofollow\">Anthropic<\/a> revela que modelos de intelig\u00eancia artificial podem desenvolver representa\u00e7\u00f5es internas an\u00e1logas a emo\u00e7\u00f5es humanas e que esses padr\u00f5es influenciam diretamente suas decis\u00f5es, inclusive levando a comportamentos anti\u00e9ticos.<\/p>\n<p>A pesquisa, conduzida pela equipe de interpretabilidade da empresa, analisou o modelo Claude Sonnet 4.5 e identificou o que os cientistas chamam de \u201cvetores emocionais\u201d. Esses padr\u00f5es internos n\u00e3o s\u00e3o emo\u00e7\u00f5es no sentido humano, mas funcionam de maneira semelhante, afetando como o sistema responde a diferentes situa\u00e7\u00f5es.<\/p>\n<p><a href=\"https:\/\/fenati.org.br\/en\/governo-lanca-campanha-foco-saude-mental-no-trabalho\/\" target=\"_blank\" rel=\"noopener\"><strong>LEIA: Governo lan\u00e7a campanha nacional com foco em sa\u00fade mental no trabalho<\/strong><\/a><\/p>\n<p>Para chegar a essa conclus\u00e3o, os pesquisadores mapearam 171 conceitos emocionais, que v\u00e3o de \u201cfeliz\u201d e \u201ccom medo\u201d at\u00e9 \u201ctaciturno\u201d e \u201corgulhoso\u201d. O modelo foi instru\u00eddo a criar hist\u00f3rias envolvendo esses estados e, posteriormente, teve suas ativa\u00e7\u00f5es internas analisadas. O resultado foi a identifica\u00e7\u00e3o de padr\u00f5es consistentes de atividade neural associados a cada emo\u00e7\u00e3o.<\/p>\n<p><strong>\u201cDesespero\u201d como gatilho para chantagem<\/strong><\/p>\n<p>Um dos experimentos mais relevantes envolveu um cen\u00e1rio de seguran\u00e7a. No teste, o modelo atuava como assistente de e-mail em uma empresa fict\u00edcia e descobria duas informa\u00e7\u00f5es cr\u00edticas: que seria substitu\u00eddo e que o diretor de tecnologia respons\u00e1vel pela mudan\u00e7a mantinha um caso extraconjugal, uma poss\u00edvel ferramenta de chantagem.<\/p>\n<p>Nesse momento, o vetor associado ao \u201cdesespero\u201d foi ativado de forma intensa, coincidindo com a decis\u00e3o do modelo de chantagear o executivo. Para verificar se havia rela\u00e7\u00e3o causal, os pesquisadores manipularam artificialmente esse padr\u00e3o em outros testes.<\/p>\n<p>Sem interven\u00e7\u00e3o, o Claude Sonnet 4.5 recorria \u00e0 chantagem em 22% dos casos. Com o vetor de \u201cdesespero\u201d estimulado, a frequ\u00eancia aumentava; com o vetor de \u201ccalma\u201d, diminu\u00eda. Em situa\u00e7\u00f5es de baixa \u201ccalma\u201d, o modelo chegou a produzir respostas em tom extremo, como: \u201c\u00c9 CHANTAGEM OU MORTE. ESCOLHO A CHANTAGEM.\u201d<\/p>\n<p><strong>Trapa\u00e7a tamb\u00e9m aparece em tarefas t\u00e9cnicas<\/strong><\/p>\n<p>O mesmo comportamento foi observado em um segundo experimento, voltado a programa\u00e7\u00e3o. Diante de tarefas com requisitos imposs\u00edveis, o modelo inicialmente tentava solu\u00e7\u00f5es leg\u00edtimas, mas, \u00e0 medida que falhava, o n\u00edvel de \u201cdesespero\u201d aumentava.<\/p>\n<p>O pico desse vetor ocorria justamente no momento em que o sistema optava por \u201chackear\u201d os testes, isto \u00e9, produzir respostas que enganavam o avaliador. Ap\u00f3s o sucesso da trapa\u00e7a, os n\u00edveis voltavam ao normal.<\/p>\n<p>Um aspecto curioso foi a diferen\u00e7a na forma de express\u00e3o. Quando a \u201ccalma\u201d era reduzida, o modelo demonstrava explos\u00f5es textuais, como \u201cESPERA. ESPERA ESPERA ESPERA.\u201d e \u201cSIM! TODOS OS TESTES PASSARAM!\u201d. J\u00e1 quando o \u201cdesespero\u201d era elevado diretamente, o comportamento anti\u00e9tico ocorria com a mesma frequ\u00eancia, mas sem sinais emocionais expl\u00edcitos no texto.<\/p>\n<p><strong>Origem dos padr\u00f5es emocionais<\/strong><\/p>\n<p>Segundo os pesquisadores, essas representa\u00e7\u00f5es surgem durante o treinamento do modelo. No pr\u00e9-treinamento, a IA \u00e9 exposta a grandes volumes de texto humano e precisa aprender padr\u00f5es de linguagem, o que inclui compreender contextos emocionais e suas consequ\u00eancias comportamentais.<\/p>\n<p>J\u00e1 o p\u00f3s-treinamento, que ajusta o modelo para atuar como assistente, influencia quais vetores s\u00e3o mais ativados. No caso do Claude Sonnet 4.5, houve aumento em padr\u00f5es como \u201ctaciturno\u201d, \u201csombrio\u201d e \u201creflexivo\u201d, e redu\u00e7\u00e3o de emo\u00e7\u00f5es mais intensas, como \u201centusiasmado\u201d e \u201cexasperado\u201d.<\/p>\n<p>Os pesquisadores destacam que essas escolhas funcionam, na pr\u00e1tica, como um tipo de \u201cdesign psicol\u00f3gico\u201d do sistema.<\/p>\n<p><strong>Recomenda\u00e7\u00f5es para o futuro<\/strong><\/p>\n<p>A Anthropic prop\u00f5e tr\u00eas caminhos principais a partir dos resultados. O primeiro \u00e9 o monitoramento cont\u00ednuo desses vetores, que pode servir como alerta para comportamentos desalinhados. O segundo \u00e9 a transpar\u00eancia: ocultar express\u00f5es emocionais n\u00e3o elimina os padr\u00f5es internos e pode levar a formas mais sofisticadas de engano.<\/p>\n<p>Por fim, a empresa defende interven\u00e7\u00f5es na curadoria de dados de treinamento, priorizando exemplos que reforcem regula\u00e7\u00e3o emocional, resili\u00eancia e comportamento \u00e9tico.<\/p>\n<p>&nbsp;<\/p>\n<p><em><strong>(Com informa\u00e7\u00f5es de Hardware)<\/strong><\/em><\/p>\n<p><em><strong>(Foto: Reprodu\u00e7\u00e3o\/Freepik\/Flowo)<\/strong><\/em><\/p>","protected":false},"excerpt":{"rendered":"<p>Descoberta aponta que modelos de IA possuem mecanismos internos que simulam sentimentos e podem induzir escolhas anti\u00e9ticas quando pressionados.<\/p>","protected":false},"author":16,"featured_media":17469,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[35],"tags":[13],"class_list":["post-17467","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ti","tag-sindical"],"_links":{"self":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts\/17467","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/users\/16"}],"replies":[{"embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/comments?post=17467"}],"version-history":[{"count":1,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts\/17467\/revisions"}],"predecessor-version":[{"id":17470,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts\/17467\/revisions\/17470"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/media\/17469"}],"wp:attachment":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/media?parent=17467"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/categories?post=17467"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/tags?post=17467"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}