• AUTOMÓVEL
    • ENSAIOS
  • ENTREVISTA
  • NEGÓCIOS
  • IMOBILIÁRIO
  • ESTUDO
  • DICAS
  • LANÇAMENTOS
  • DESTINOS
  • WELLNESS
  • LINKS
    • BELEZA
    • DESIGN
    • DESPORTO
    • EVENTO
    • LIVROS
    • MODA
    • SAÚDE
    • SUSTENTÁVEL
    • TECNOLOGIA
ÚLTIMAS !

Cegid apoia Barbot na criação de uma “fábrica inteligente” com software de gestão que liga máquinas, pessoas e equipamentos

16 de Janeiro, 2026

Signify obtém classificação CDP ‘A’ por desempenho climático e transparência

16 de Janeiro, 2026

Microsoft identifica sete tendências de IA para 2026

16 de Janeiro, 2026
Facebook LinkedIn Instagram
LinkedIn Facebook Instagram
Creative News
loader

  • AUTOMÓVEL
    1. ENSAIOS
    2. VER TODOS

    Polestar 3 – sofisticação elétrica com foco no essencial

    15 de Janeiro, 2026

    Volvo XC60 T6 AWD Plug-in Hybrid: quando a eletrificação encontra a elegância escandinava

    16 de Dezembro, 2025

    Volvo EX30: A essência da simplicidade elétrica com ambição premium

    5 de Dezembro, 2025

    Volvo EC40: o crossover elétrico que redefine elegância e eficiência

    20 de Novembro, 2025

    Polestar 3 – sofisticação elétrica com foco no essencial

    15 de Janeiro, 2026

    MAZDA estreia nova cor NAVY BLUE no MAZDA CX-5

    15 de Janeiro, 2026

    EX60 será o primeiro Volvo com Gemini integrado: um automóvel com o qual pode ter uma conversa natural

    15 de Janeiro, 2026

    Novo Volvo EX60: um SUV nunca visto com autonomia de 810 km e carregamento tão rápido quanto parar para abastecer e tomar um café

    14 de Janeiro, 2026
  • ENTREVISTA

    Anos de Coragem – Entrevista a Elaine Serra

    26 de Setembro, 2025

    A linguagem da beleza – Entrevista a Jo Stenuit

    2 de Dezembro, 2024

    Entrevista a Vítor Martins, Diretor Comercial da JCDecaux

    7 de Agosto, 2023

    Entrevista a Sérgio Rodrigues, CEO da StoresAce

    2 de Maio, 2023

    Nomeação de Rui Cruz para a direção geral da Opensoft

    30 de Março, 2023
  • NEGÓCIOS

    ARVAL BRASIL ANUNCIA CRISTIANE MIREILLE COMO NOVA GERENTE GERAL

    9 de Janeiro, 2026

    Anna Golsa foi nomeada nova CEO global do Grupo Eurofirms

    3 de Janeiro, 2026

    Parceria entre Eurofirms e Huawei forma 15 mil profissionais

    19 de Novembro, 2025

    IVECO reforça a logística sustentável com 42 novos camiões S-Way a gás natural ao serviço da TESCO, na Escócia

    10 de Outubro, 2025

    Dachser consolida o compromisso com entregas 100% elétricas em Barcelona

    10 de Setembro, 2025
  • IMOBILIÁRIO

    Casas para arrendar em Portugal: preço abranda subida no fim de 2025

    12 de Janeiro, 2026

    Comprar casa no Centro custa agora 280.000€, com Santarém e Leiria em destaque

    6 de Novembro, 2025

    MOME e Revive lançam projeto residencial de 140M€ no Porto

    7 de Outubro, 2025

    Casas à venda em Portugal: oferta está apenas 5% acima do mínimo de 2022

    24 de Setembro, 2025

    Comprar casa em Portugal ficou 8,5% mais caro no último ano

    1 de Agosto, 2025
  • ESTUDO

    Liderança: Homens priorizam “talento” e as mulheres a “conciliação familiar”

    13 de Janeiro, 2026

    Experis revela estratégias para empresas ajudarem as equipas a prosperar com a IA

    11 de Janeiro, 2026

    Falta de habilitações trava reinserção de quase metade dos desempregados em Portugal

    9 de Janeiro, 2026

    Maioria das empresas de TI em Portugal pretende contratar no início de 2026, mas automação está a impactar redução de emprego

    3 de Janeiro, 2026

    A importância de integrar diferentes gerações nas empresas

    1 de Janeiro, 2026
  • DICAS

    Estratégias para transformar insegurança em confiança no trabalho

    14 de Dezembro, 2025

    5 erros comuns na contabilidade das empresas

    4 de Dezembro, 2025

    7 dicas práticas para poupar 5 mil euros

    1 de Novembro, 2025

    Quais são os três fatores a ter em conta para trocar os pneus do carro?

    9 de Outubro, 2025

    Regresso ao trabalho: 8 estratégias para voltar com mais motivação

    28 de Agosto, 2025
  • LANÇAMENTOS

    Moeve e DECO PRO teste renovam parceria e reforçam benefícios para os consumidores

    15 de Janeiro, 2026

    Marca centenária propõe um Natal hidratado e perfumado – SUGESTÕES DE NATAL COUTO

    10 de Novembro, 2025

    h3 reinventa a tradição e lança o novo h3 Pica-Pau: Para picar sem parar

    24 de Outubro, 2025

    Do Mar ao Pulso: uma viagem com a Panerai e o Eilean

    25 de Agosto, 2025

    Açores traçam novo rumo: Lançamento do primeiro barco 100% eléctrico, inaugurando uma Era Verde para o Turismo

    9 de Agosto, 2025
  • DESTINOS

    Algarve recebe nota positiva dos turistas

    14 de Agosto, 2025

    Cidades nacionais mais procuradas pelos turistas portugueses

    1 de Julho, 2025

    Duas praias portuguesas entre as mais originais e secretas da Europa, segundo a Jetcost

    10 de Junho, 2025

    Zoomarine abre portas a 7 de março com novidades preparadas para a nova temporada

    26 de Fevereiro, 2024

    Dados eDreams: Paris volta a ser o destino de eleição dos portugueses nesta Páscoa

    3 de Abril, 2023
  • WELLNESS

    LLYC conquista Eficácia da Comunicação com campanha para Dove

    5 de Dezembro, 2021

    SERENITY SPA celebra a BLACK friday durante uma semana

    16 de Novembro, 2021

    Ser piloto por um dia ou observar as estrelas no Alentejo: os hotéis Moov oferecem novas experiências

    12 de Agosto, 2021

    Programa de verão do Spa Caudalie no The Yeatman: Divina por dentro e por fora

    9 de Agosto, 2021

    Yoga, alimentação saudável e ar puro do Douro: The Vintage House lança programa “Winefulness”

    9 de Agosto, 2021
  • LINKS
    1. BELEZA
    2. DESIGN
    3. DESPORTO
    4. EVENTO
    5. LIVROS
    6. MODA
    7. SAÚDE
    8. SUSTENTÁVEL
    9. TECNOLOGIA
    10. VER TODOS

    Um terço dos homens diz sentir dificuldade em aceder aos cuidados de saúde

    4 de Agosto, 2025

    GIVENCHY APRESENTA GENTLEMAN SOCIETY EAU DE PARFUM REFILL

    16 de Junho, 2025

    KÉRASTASE abre uma pop-up em NYC com as embaixadoras Emily Ratajkowski, Sydney Sweeney, Ebonne Davis, Margarida Corceiro e Caetana Botelho Afonso

    10 de Abril, 2025

    Os erros mais cometidos na hora de escolher a base

    14 de Novembro, 2024

    Mónica de Miranda, Prémio idealista de arte contemporânea 2023

    30 de Abril, 2023

    2ª edição do Prémio Adico distingue inovação e ecodesign

    23 de Abril, 2023

    Estudante portuguesa de design vence o Primeiro Concurso Europeu ECCO DESIGN LAB

    19 de Fevereiro, 2023

    IMPERFEITA 1.3: a idade não nos define

    17 de Fevereiro, 2023

    Maria Luís Gameiro pronta para a sua (segunda) grande aventura

    3 de Janeiro, 2026

    Michelin celebra sete temporadas de inovação no Campeonato do Mundo FIM MotoE™: termina um ciclo desportivo e é alcançado um feito tecnológico

    14 de Novembro, 2025

    Liga MEO Surf – Francisca Veselko e Afonso Antunes conquistam Bom Petisco Peniche Pro

    26 de Outubro, 2025

    Os dois PEUGEOT 9X8 destacam-se, com um segundo lugar e um Top 5 no Japão

    29 de Setembro, 2025

    ROCK IN RIO Lisboa junta-se à LIGA PORTUGAL para unir as duas maiores paixões dos Portugueses: Música e Futebol

    13 de Janeiro, 2026

    Quando a IA Encontra a Liderança: o Futuro do Trabalho em Debate no ISEG

    7 de Janeiro, 2026

    ROCK IN RIO LISBOA ANUNCIA BACANAPLAY COMO PATROCINADOR OFICIAL DO DIGITAL STAGE

    27 de Dezembro, 2025

    A 2 de fevereiro os Prémios Mesa Marcada voltam para distinguir os melhores do ano

    13 de Dezembro, 2025

    Nuvem de Ideias: nova editora dedica-se ao livro como ferramenta de comunicação

    11 de Junho, 2024

    Bibá Pitta é a embaixadora dos livros bestsellers “Avó, fala-me de ti” e “Avô, fala-me de ti”, pelo terceiro ano consecutivo

    12 de Dezembro, 2023

    Publicado o livro gratuito “25 Espécies Aquáticas que Estão a Invadir Portugal”

    18 de Novembro, 2023

    VIAJA! – Um livro para todos aqueles que têm o “bichinho” das viagens

    25 de Outubro, 2023

    MO inaugura nova loja em MARCO de CANAVESES

    23 de Janeiro, 2024

    AICEP promove moda sustentável no mercado internacional

    17 de Novembro, 2023

    Designer de moda Luís Carvalho é o Primeiro Embaixador da marca em Portugal

    21 de Setembro, 2023

    Estudante portuguesa de design vence o Primeiro Concurso Europeu ECCO DESIGN LAB

    19 de Fevereiro, 2023

    Sabe o que é a Terapia sacro craniana?

    12 de Janeiro, 2026

    O verão também é tempo de prevenção no cancro de pulmão

    8 de Agosto, 2025

    ESTeSC integra projeto europeu de 3 milhões que melhora segurança dos exames médicos infantis

    7 de Maio, 2025

    Exercício durante a gravidez: a chave para o bem-estar físico e emocional

    5 de Maio, 2025

    Especialistas preparam estratégia urbanística para adaptar Lisboa às alterações climáticas

    24 de Junho, 2025

    Lagoas Park quer aumentar a produção de energia para consumo próprio

    15 de Março, 2024

    RAIZ quer trazer a agricultura urbana a mais bairros de Portugal

    16 de Outubro, 2023

    Adico: Redução da pegada ambiental equivale a menos 213 mil quilómetros percorridos

    12 de Junho, 2023

    Microsoft identifica sete tendências de IA para 2026

    16 de Janeiro, 2026

    Novartis aposta em agentes de IA com a Salesforce a nível global

    12 de Janeiro, 2026

    Copilot assume papel central na vida digital: saúde e conselhos pessoais lideram utilização

    10 de Janeiro, 2026

    81% dos empregadores de Logística e Transportes acreditam que a IA vai transformar os perfis profissionais

    9 de Janeiro, 2026

    Cegid apoia Barbot na criação de uma “fábrica inteligente” com software de gestão que liga máquinas, pessoas e equipamentos

    16 de Janeiro, 2026

    Signify obtém classificação CDP ‘A’ por desempenho climático e transparência

    16 de Janeiro, 2026

    Microsoft identifica sete tendências de IA para 2026

    16 de Janeiro, 2026

    Polestar 3 – sofisticação elétrica com foco no essencial

    15 de Janeiro, 2026
Creative News
Home»Formação»A medição é a chave para ajudar a manter a IA no caminho certo
Formação

A medição é a chave para ajudar a manter a IA no caminho certo

23 de Setembro, 2024
Facebook Twitter LinkedIn WhatsApp Email

Quando Hanna Wallach começou a testar modelos de machine learning, as tarefas eram bem definidas e fáceis de avaliar. O modelo foi capaz de identificar corretamente os gatos na imagem? Conseguiu prever com precisão as classificações que diferentes espectadores atribuíram a um filme? Transcreveu as palavras exatas que alguém acabou de proferir?

Contudo, este trabalho de avaliação do desempenho de um modelo foi transformado pela criação de IA generativa, como grandes modelos de linguagem (LLMs) que interagem com as pessoas. Portanto, o foco de Wallach, enquanto investigadora na Microsoft, mudou para identificar as respostas da IA para potenciais riscos que não são fáceis de quantificar – “conceitos humanos difusos”, refere, tais como a justiça ou a segurança psicológica.

Esta nova abordagem à medição, ou seja, definir e avaliar os riscos da IA e garantir que as soluções são eficazes, analisa os elementos sociais e técnicos da forma como a tecnologia generativa interage com as pessoas. Isto torna-a muito mais complexa, mas também fundamental para ajudar a manter a IA segura para todos.

“Muito daquilo que minha equipa faz consiste em descobrir como essas ideias provenientes das ciências sociais podem ser usadas no contexto da IA responsável”, afirma Wallach. “Não é possível entender os aspetos técnicos da IA sem entender os aspetos sociais e vice-versa.”

A sua equipa de cientistas na Microsoft Research analisa os riscos a partir do feedback dos clientes, investigadores, equipas de produto e de políticas da Microsoft e a  AI Red Team da empresa – um grupo de tecnólogos e outros especialistas que se debruçam sobre os sistemas de IA para perceber onde é que as coisas podem falhar. 

Quando potenciais problemas surgem – com injustiças, por exemplo, como um sistema de IA que mostra apenas mulheres na cozinha ou apenas homens como CEOs – a equipa de Wallach e outros colaboradores da empresa intervêm para compreender e definir o contexto e a extensão desses riscos e todas as diferentes formas pelas quais eles podem surgir em várias interações com o sistema.

Após as restantes equipas desenvolverem correções para quaisquer riscos com os quais os utilizadores se possam deparar, o grupo de Wallach mede novamente as respostas do sistema para garantir que esses ajustes foram eficazes.

A investigadora e os seus colegas debatem-se com conceitos nebulosos, como o que significa para a IA estereotipar ou depreciar grupos específicos de pessoas. A sua abordagem adapta estruturas da linguística e das ciências sociais para estabelecer definições concretas, respeitando quaisquer significados contestados – um processo conhecido como “sistematização”. Uma vez definido ou sistematizado um risco, começam a medi-lo recorrendo a técnicas de anotação ou métodos usados para rotular as respostas do sistema, em interações simuladas e do mundo real. Em seguida, classificam essas respostas para ver se o sistema de IA teve um desempenho aceitável ou não.

O trabalho da equipa ajuda nas decisões de engenharia, fornecendo informações pormenorizadas aos especialistas da Microsoft à medida que desenvolvem mitigações. O grupo também apoia as decisões de política interna da empresa, ajudando os líderes a decidir se e quando um sistema está pronto para implementação.

Como os sistemas de IA generativa lidam com texto, imagens e outras modalidades que representam a sociedade e o mundo ao nosso redor, a equipa de Wallach foi formada com uma combinação única de conhecimentos. O seu grupo inclui cientistas com formação em ciências da computação e linguística que estudam a forma como diferentes tipos de riscos se podem manifestar. Para além disso, fazem parcerias com investigadores, especialistas de domínio, consultores de políticas, engenheiros, entre outros, para incluir o maior número possível de perspetivas e antecedentes.

À medida que os sistemas de IA se tornam mais prevalentes, é cada vez mais importante que representem e tratem os grupos marginalizados de forma justa. No ano passado, por exemplo, o grupo trabalhou com a equipa do Diretor de Acessibilidade da Microsoft para entender os riscos relacionados à equidade que afetam as pessoas com deficiência. Começaram por aprofundar o significado de representar as pessoas com deficiência de forma justa e identificar como as respostas do sistema de IA podem refletir o capacitismo. O grupo também se envolveu com líderes comunitários para obter informações sobre as experiências que as pessoas com deficiência têm ao interagir com a IA.

Transformar essas conclusões num conceito claramente sistematizado ajuda no desenvolvimento de métodos para medir os riscos, rever os sistemas conforme necessário e monitorar a tecnologia para garantir uma melhor experiência para as pessoas com deficiência.

Uma das novas ferramentas metodológicas que a equipa de Wallach ajudou a desenvolver, as avaliações de segurança do Azure AI Studio, utiliza a própria IA generativa – um avanço que pode medir e monitorar continuamente sistemas cada vez mais complexos e generalizados, afirma Sarah Bird, Diretora de Produtos de IA Responsável da Microsoft.

Assim que a ferramenta recebe os dados corretos e a formação sobre como rotular os resultados de um sistema de IA, esta representa um papel – por exemplo, quando alguém está a tentar obter conteúdo sexual impróprio. Em seguida, classifica as respostas do sistema, com base em diretrizes que refletem o risco cuidadosamente sistematizado. As classificações resultantes são, então, agrupadas utilizando métricas para avaliar a extensão do risco. Grupos de especialistas auditam regularmente os testes para garantir que são precisos e alinhados com as classificações dos humanos, comenta Bird.

“Fazer com que o sistema de IA se comporte como os especialistas é algo que exige muito trabalho e inovação. É realmente desafiador e divertido de desenvolver”, à medida que a Microsoft investe neste campo da ciência da avaliação em evolução, diz Bird.

Os clientes da Microsoft também podem usar a ferramenta para medir o desempenho dos seus chatbots ou outros sistemas de IA em relação aos seus objetivos de segurança específicos.

“A avaliação é a coisa robusta que nos ajuda a entender como um sistema de IA se está a comportar em escala”, conta Bird. “Como saberemos se nossas mitigações e soluções são eficazes se não as medirmos? Esta é a coisa mais importante no que concerne à IA responsável atualmente.”

Saiba mais sobre o trabalho da Microsoft em prol da Responsible AI.

Share. Facebook LinkedIn Twitter WhatsApp Email
AnteriorZome junta-se à série “Mudar para Melhor” para destacar oportunidades no setor imobiliário
Próximo Alfândega do Porto recebe Mercadinho do Bebé, o maior evento para grávidas e recém-mamãs do país

Relacionados

Microsoft identifica sete tendências de IA para 2026

16 de Janeiro, 2026

Novartis aposta em agentes de IA com a Salesforce a nível global

12 de Janeiro, 2026

ÚLTIMAS
Notícias

Cegid apoia Barbot na criação de uma “fábrica inteligente” com software de gestão que liga máquinas, pessoas e equipamentos

16 de Janeiro, 2026

A Cegid, líder europeu em soluções de gestão empresarial na cloud para profissionais das áreas…

Signify obtém classificação CDP ‘A’ por desempenho climático e transparência

16 de Janeiro, 2026

Microsoft identifica sete tendências de IA para 2026

16 de Janeiro, 2026
SIGA-NOS!
  • LinkedIn
  • Facebook
  • Instagram
  • WhatsApp

Subscreva a Newsletter

Aceito receber a newsletter da Creative News que pode conter ocasionalmente informações sobre iniciativas, produtos e serviços.

Email : press@creativedesign.pt
Contacto: +351 913 163 426 (tarifa de rede móvel)
Política de Privacidade
Estatuto Editorial

Facebook Instagram LinkedIn

Digite acima e pressione Enter para pesquisar. Pressione Esc para cancelar.