Alguns detalhes adicionais e pequenas correções do que falei anteriormente. Vou botar numa “sanfona” para não poluir o tópico.
Clique pra expandir e ler
O cinza pode ser branco
Falei que o papel é na verdade cinza, mas isso vai depender da iluminação que incide sobre ele. Em scanners, o fundo do papel pode chegar ao branco digital absoluto (#FFFFFF) com a luz do scanner incidindo sobre ele, mas o nível de luminosidade influencia nos demais elementos, como a marcação de caneta: se o brilho for muito, pode estourar o brilho da caneta, aumentando sua luminância (componente Y) e, portanto, reduzindo contraste.
Química é uma ciência exata, mas não é exata
Cada caneta tem uma composição diferente: o azul da Bic é diferente do azul da Compactor, porque a Bic usa uma composição para a tinta e a Compactor usa outra, e mesmo canetas da mesma marca vão ter diferenças porque a composição química dificilmente consegue ser exata e milimétrica em processos industriais (como a fabricação de canetas).
Essas duas coisas vão gerar diferenças, ainda que sutis, de luminância na marcação das canetas. Porém, exames como o ENEM (que é estatal) não podem forçar uma marca em específico (“só canetas Bic”) porque isso poderia gerar dúvidas quanto à isenção do exame.
Calibragem
Entra ali outro fator: calibragem do scanner. Calibram o scanner para antecipar as diferenças entre as várias marcas de canetas (e diferenças mínimas da composição química de uma mesma marca).
E por que a calibragem? Por causa do contraste que mencionei anteriormente. Um OCR (Optical Character Recognition) precisa distinguir entre duas áreas: onde está marcado vs onde não está marcado. Por isso o fator do “monocromático” ali: converte-se os três canais de cores (RGB) em um só (Luma/Y) para que alimente o algoritmo de OCR, que vai fazer a quantização (em português: “até certo nível de cinza, é zero/desmarcado, a partir disso, é um/marcado”) e segmentação das áreas congruentes (isto é: quais áreas próximas estão marcadas, e quais áreas próximas estão desmarcadas, o que envolve aplicações técnicas como convolução matricial).
Hoje em dia tem as IAs (Visual Models) mas elas frequentemente alucinam (basta ver Grok, ChatGPT, Gemini e afins, quando interpretam imagens), e a visão computacional sobre um gabarito precisa ser a mais exata e precisa possível, então certamente não usam modelos visuais para tal. O que nos leva à seguinte citação sua:
Antiquado? É mesmo, podemos chamar assim, sim, mas imagina se a IA alucinasse uma marcação que não foi feita? Por isso usam algoritmos “consolidados” de OCR, que envolvem algoritmos meticulosamente arquitetados para quantizar gabaritos , por isso também aqueles “quadradinhos” nas beiradas do gabarito (que servem pra alinhar um objeto do mundo real, a folha, em uma “malha” virtual, mas também dão uma referência para o nivelamento da luminosidade):
Caneta preta… ou lápis?
Depois que fiz a postagem anterior, eu pesquisei sobre esse lance da caneta preta. Acontece que a caneta preta, ao olho nu, pode parecer uma marcação à lápis, e lápis é obviamente proibido (porque pode ser apagado, ou o candidato poderia alegar que a resposta original foi apagada). Há uma inspeção visual superficial, onde um ser humano olha a folha a fim de identificar possíveis rasuras, e essa inspeção vai também observar se foi feito à caneta: se não foi, nem vão passar pro scanner, vão logo reprovar aquele gabarito.
Não sei por que tem exames que permitem (como vestibular), mas talvez seja pela quantidade: menos candidatos, menos gabaritos pra inspecionar, então dá pra inspecionar melhor se é lápis ou caneta. ENEM tem muito candidato (milhões), e quanto menos tempo eles gastam com os gabaritos, mais rápido lançam os milhões de resultados no sistema.