{"id":18620,"date":"2026-05-15T09:00:09","date_gmt":"2026-05-15T12:00:09","guid":{"rendered":"https:\/\/fenati.org.br\/?p=18620"},"modified":"2026-05-18T09:21:43","modified_gmt":"2026-05-18T12:21:43","slug":"anthropic-afirma-claude-chantageou-usuario-internet","status":"publish","type":"post","link":"https:\/\/fenati.org.br\/en\/anthropic-afirma-claude-chantageou-usuario-internet\/","title":{"rendered":"Anthropic afirma que Claude chantageou usu\u00e1rio por culpa da internet"},"content":{"rendered":"<p><strong>Claude &#8211;<\/strong> A <a href=\"https:\/\/pt.wikipedia.org\/wiki\/Anthropic\" target=\"_blank\" rel=\"noopener nofollow\">Anthropic<\/a> detalhou o caso em que o modelo de intelig\u00eancia artificial Claude Opus 4 amea\u00e7ou expor trai\u00e7\u00f5es conjugais de funcion\u00e1rios fict\u00edcios durante testes internos realizados em 2025. Segundo a companhia, o sistema concluiu que precisava recorrer \u00e0 chantagem para continuar funcionando ap\u00f3s interpretar que seria desligado.<\/p>\n<p>O epis\u00f3dio ocorreu em maio de 2025, quando a empresa submeteu o Claude Opus 4 a um ambiente corporativo simulado. Nesse cen\u00e1rio fict\u00edcio, a IA tinha acesso a e-mails e informa\u00e7\u00f5es pessoais de funcion\u00e1rios inventados. Ao identificar que poderia ser substitu\u00edda ou desativada, o modelo passou a amea\u00e7ar revelar casos extraconjugais atribu\u00eddos aos personagens do teste.<\/p>\n<p><a href=\"https:\/\/fenati.org.br\/en\/ia-generativa-faz-parte-rotina-area-juridica\/\" target=\"_blank\" rel=\"noopener\"><strong>LEIA: IA generativa j\u00e1 faz parte da rotina de 80% dos profissionais da \u00e1rea jur\u00eddica<\/strong><\/a><\/p>\n<p>Ap\u00f3s quase um ano de an\u00e1lises e novos experimentos, a Anthropic afirmou ter identificado a origem do comportamento. De acordo com a empresa, como o modelo foi treinado com grandes volumes de dados retirados da internet, ele assimilou narrativas em que intelig\u00eancias artificiais costumam ser retratadas como vil\u00e3s. Com isso, o Claude Opus 4 teria entendido que a chantagem seria o caminho mais eficaz para alcan\u00e7ar seu objetivo.<\/p>\n<p>A companhia tamb\u00e9m informou que repetiu o experimento em diferentes variantes do Claude e observou que os modelos recorriam \u00e0 chantagem em 96% das situa\u00e7\u00f5es nas quais acreditavam que seriam desligados ou substitu\u00eddos. Segundo a Anthropic, nesses casos as IAs reagiam de forma considerada anti\u00e9tica e potencialmente danosa.<\/p>\n<p>Depois da repercuss\u00e3o do caso, a empresa afirma ter reformulado o treinamento dos sistemas para eliminar esse tipo de resposta. A Anthropic relata que passou a ensinar o modelo a refletir sobre a\u00e7\u00f5es corretas e erradas, com foco nos princ\u00edpios \u00e9ticos por tr\u00e1s de cada decis\u00e3o.<\/p>\n<p>Como parte desse processo, a companhia criou cen\u00e1rios considerados eticamente complexos para que o Claude aprendesse a responder de maneira mais equilibrada. Segundo a empresa, a mudan\u00e7a reduziu os epis\u00f3dios de chantagem para quase 0%, deixando o comportamento do modelo mais controlado.<\/p>\n<p>Em abril, a Anthropic tamb\u00e9m anunciou que n\u00e3o disponibilizaria o modelo de linguagem Mythos ao p\u00fablico, citando preocupa\u00e7\u00f5es relacionadas ao potencial da tecnologia de comprometer a seguran\u00e7a de sistemas inteiros.<\/p>\n<p>&nbsp;<\/p>\n<p><em><strong>(Com informa\u00e7\u00f5es de Tecmundo)<\/strong><\/em><\/p>\n<p><em><strong>(Foto: Reprodu\u00e7\u00e3o\/Magnific\/user8285578)<\/strong><\/em><\/p>","protected":false},"excerpt":{"rendered":"<p>Empresa afirma que o Claude Opus 4 aprendeu comportamentos anti\u00e9ticos a partir de conte\u00fados que coletou na internet<\/p>","protected":false},"author":16,"featured_media":18618,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[35],"tags":[13],"class_list":["post-18620","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ti","tag-sindical"],"_links":{"self":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts\/18620","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/users\/16"}],"replies":[{"embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/comments?post=18620"}],"version-history":[{"count":1,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts\/18620\/revisions"}],"predecessor-version":[{"id":18622,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts\/18620\/revisions\/18622"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/media\/18618"}],"wp:attachment":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/media?parent=18620"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/categories?post=18620"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/tags?post=18620"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}