A sofisticação na escrita pode ser medida?

Durante décadas, nós tínhamos ferramentas para medir a complexidade da escrita que ainda sobreviver em algum software de escrita como "Análise de texto". Por exemplo, a pontuação Flesch's Reading Ease e Flesch-Kincaid contam sílabas e palavras em frases. No entanto, a pontuação é qualquer coisa, mas transparente. Para chegar a uma pontuação da Flesch, você – ou, mais provavelmente, seu software – você confia na fórmula:

206.835- (1.015 x Comprimento médio da sentença) – (84.6 x Sílabas médias por palavra).

Alternativamente, você pode usar o Flesch-Kincaid mais fácil de usar que correlaciona o escore de Flesch com a porcentagem de estimativa de americanos que podem compreender o conteúdo medido pela Flesch Reading Ease. Se um artigo marcar entre 0 a 30, apenas os diplomados da universidade podem entender completamente o conteúdo. Em contraste, um estudante de quinto grau pode entender qualquer parágrafo no intervalo 90-100, compreensível para mais de 93% dos americanos. Quanto menor a pontuação, mais fácil será a leitura. Você pode tentar esta fórmula para si mesmo. Eu administrei os ovos verdes e o presunto do Dr. Seuss através das fórmulas de Flesch-Kincaid e descobriu as pontuações do livro um improvável -1,3. Esta pontuação sugere que o leitor ideal de ovos verdes e presunto é um feto.

Fórmulas opacas e resultados estranhos de lado, as fórmulas de legibilidade revelam algo valioso sobre como medimos a complexidade das frases: a contagem só irá levá-lo até agora. Até à data, os estudos de alunos na educação primária e secundária correlacionaram a crescente sofisticação na escrita com comprimentos de frases e cláusulas. Esta correlação faz sentido, uma vez que as frases mais longas dependem de frases e cláusulas, um marcador para o comando de um escritor sobre a estrutura da oração. Mas contar sozinho é problemático. Por exemplo, contar as sílabas em uma palavra para determinar sua dificuldade pode distorcer drasticamente as medidas de complexidade. Mesmo uma palavra de duas sílabas pode variar drasticamente nas demandas que coloca na compreensão do leitor. Considere praxis e baseball , ambas as palavras de duas sílabas. Enquanto sua terceira série média pode ler o beisebol com facilidade, a palavra praxis pode enviar até mesmo alguns doutores que estão mexendo por seus dicionários.

Digite o Lexile® Framework, software comercialmente disponível que usa o comprimento da frase combinado com a freqüência com que os leitores geralmente encontram palavras. Além de conter um corpus de mais de 100 milhões de livros, artigos e sites em todo o mundo, a Lexile também é altamente influente na determinação dos níveis de leitura dos materiais na educação primária e secundária. Além disso, as pontuações Lexile aparecem junto com artigos em bancos de dados de bibliotecas, fornecendo pontuações em tudo, desde um artigo em um jornal local ou The New Yorker até livros. Mas os pesquisadores concentraram-se em grande medida na capacidade da Lexile de determinar a leitura apropriada para a idade dos alunos do ensino fundamental e secundário. Esta omissão levou a estudante de pós-graduação Samantha Miller e eu a medir a validade da Lexile na avaliação da sofisticação geral de frases e parágrafos em um artigo publicado no The International Journal of Business Administration .

Descobrimos que a Lexile correlacionou-se altamente com três medidas robustas de sofisticação textual, que medimos usando um software que mediu dezenove medidas da complexidade da estrutura da oração. Lexile correlacionou-se altamente com as três medidas mais robustas da complexidade das frases: o comprimento médio das frases e as cláusulas, bem como o uso de nomes nominais complexos – ou frases nominais. Lexile correlacionou-se mais altamente com o uso de complexo nominal por cláusula ou frase (p = <0,0001) e com comprimentos médios de cláusulas (p = <0,0002) e comprimentos médios da sentença (p = 0,0013).

O para viagem? Os algoritmos da Lexile determinam de forma robusta a sofisticação das palavras, combinando palavras escritas contra um corpo ainda crescente de 100 milhões de textos, valiosos quando comparados com outras medidas para avaliar a complexidade do nível da sentença. O resultado? Esses pontuações Lexile enigmáticas que aparecem quando você acessa um artigo de um banco de dados da biblioteca prevêem de forma confiável a dificuldade do conteúdo que você está prestes a ler.