{"id":16834,"date":"2026-03-26T14:00:11","date_gmt":"2026-03-26T17:00:11","guid":{"rendered":"https:\/\/fenati.org.br\/?p=16834"},"modified":"2026-03-27T11:29:09","modified_gmt":"2026-03-27T14:29:09","slug":"consultoria-queda-custo-ia-alerta-aumento-gasto","status":"publish","type":"post","link":"https:\/\/fenati.org.br\/en\/consultoria-queda-custo-ia-alerta-aumento-gasto\/","title":{"rendered":"Consultoria prev\u00ea queda no custo de IA, mas alerta para aumento no gasto total"},"content":{"rendered":"<p><strong>IA &#8211;<\/strong> O custo de uso da intelig\u00eancia artificial generativa deve cair de forma significativa nos pr\u00f3ximos anos, segundo proje\u00e7\u00e3o do <a href=\"https:\/\/pt.wikipedia.org\/wiki\/Gartner_Group\" target=\"_blank\" rel=\"noopener nofollow\">Gartner<\/a>. A consultoria estima uma redu\u00e7\u00e3o superior a 90% no custo de infer\u00eancia em modelos de linguagem de grande porte (LLMs) com 1 trilh\u00e3o de par\u00e2metros at\u00e9 2030, em compara\u00e7\u00e3o com 2025.<\/p>\n<p>De acordo com a an\u00e1lise, essa queda ser\u00e1 impulsionada por uma combina\u00e7\u00e3o de fatores tecnol\u00f3gicos, como melhorias em semicondutores, evolu\u00e7\u00e3o na arquitetura dos modelos, maior efici\u00eancia no uso de chips e a ado\u00e7\u00e3o crescente de sil\u00edcio especializado e computa\u00e7\u00e3o de borda.<\/p>\n<p><a href=\"https:\/\/fenati.org.br\/en\/justica-meta-google-vicio-adolescentes-redes-sociais\/\" target=\"_blank\" rel=\"noopener\"><strong>LEIA: Justi\u00e7a dos EUA condena Meta e Google por v\u00edcio de adolescentes em redes sociais<\/strong><\/a><\/p>\n<p>O Gartner tamb\u00e9m projeta que, at\u00e9 o fim da d\u00e9cada, modelos desse porte poder\u00e3o ser at\u00e9 100 vezes mais eficientes em custo em rela\u00e7\u00e3o aos primeiros sistemas equivalentes desenvolvidos em 2022.<\/p>\n<p>Para chegar a essas estimativas, a consultoria considerou dois cen\u00e1rios distintos de infraestrutura. Um deles \u00e9 baseado em chips de \u00faltima gera\u00e7\u00e3o (frontier), enquanto o outro combina tecnologias mais novas com semicondutores legados (legacy blend). Neste segundo cen\u00e1rio, os custos permanecem mais elevados devido \u00e0 menor capacidade computacional dispon\u00edvel.<\/p>\n<p>Apesar da tend\u00eancia de queda no custo unit\u00e1rio dos tokens, unidades de dados processadas pelos modelos de IA generativa, o Gartner alerta que essa redu\u00e7\u00e3o n\u00e3o ser\u00e1 totalmente repassada \u00e0s empresas. Al\u00e9m disso, aplica\u00e7\u00f5es mais avan\u00e7adas, como sistemas baseados em agentes, tendem a demandar um volume significativamente maior de tokens por tarefa, variando entre cinco e 30 vezes o consumo de um chatbot tradicional.<\/p>\n<p>Esse aumento no uso pode neutralizar parte dos ganhos de efici\u00eancia. Mesmo com a redu\u00e7\u00e3o no pre\u00e7o por token, o crescimento no volume de consumo deve pressionar os custos totais de infer\u00eancia. A avalia\u00e7\u00e3o \u00e9 de que a expans\u00e3o do uso da IA generativa, somada \u00e0 maior complexidade das aplica\u00e7\u00f5es, pode levar a um aumento no gasto geral com processamento.<\/p>\n<p>Diante desse cen\u00e1rio, o Gartner aponta que o diferencial competitivo estar\u00e1 nas plataformas capazes de orquestrar diferentes modelos de forma eficiente. A recomenda\u00e7\u00e3o \u00e9 direcionar tarefas recorrentes para modelos menores e especializados, enquanto modelos maiores devem ser utilizados apenas em aplica\u00e7\u00f5es que exijam racioc\u00ednio mais complexo e ofere\u00e7am maior retorno financeiro.<\/p>\n<p>&nbsp;<\/p>\n<p><em><strong>(Com informa\u00e7\u00f5es de TI Inside)<\/strong><\/em><\/p>\n<p><em><strong>(Foto: Reprodu\u00e7\u00e3o\/Freepik\/Frolopiaton Palm)<\/strong><\/em><\/p>","protected":false},"excerpt":{"rendered":"<p>Redu\u00e7\u00e3o ser\u00e1 impulsionada por avan\u00e7os tecnol\u00f3gicos, mas aumento no uso e na complexidade das aplica\u00e7\u00f5es pode elevar o gasto total com IA<\/p>","protected":false},"author":16,"featured_media":16835,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[42],"tags":[13],"class_list":["post-16834","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-noticias","tag-sindical"],"_links":{"self":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts\/16834","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/users\/16"}],"replies":[{"embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/comments?post=16834"}],"version-history":[{"count":2,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts\/16834\/revisions"}],"predecessor-version":[{"id":16842,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/posts\/16834\/revisions\/16842"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/media\/16835"}],"wp:attachment":[{"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/media?parent=16834"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/categories?post=16834"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/fenati.org.br\/en\/wp-json\/wp\/v2\/tags?post=16834"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}