Introdução ao Rastreamento de Conhecimento
O Rastreamento de Conhecimento (KT) desempenha um papel crucial nos Sistemas de Tutoria Inteligentes (ITS) ao modelar os estados de conhecimento dos alunos e prever seu desempenho futuro. Os modelos tradicionais de KT, como o Rastreamento de Conhecimento Bayesiano (BKT) e as abordagens baseadas em aprendizado profundo, como o Deep Knowledge Tracing (DKT), demonstraram eficácia na aprendizagem de interações de estudantes. No entanto, os avanços recentes nos modelos sequenciais de KT, como o Rastreamento de Conhecimento Atento (AKT), têm priorizado cada vez mais o desempenho preditivo em relação à aplicabilidade prática e ao modelamento de conhecimento abrangente.
Limitações dos Modelos de Rastreamento de Conhecimento
Esses modelos frequentemente enfrentam desafios fundamentais, incluindo limitada eficiência de computação paralela, dificuldades em modificar o conhecimento armazenado e capacidade de armazenamento restrita. Além disso, muitos modelos de KT baseados em aprendizado profundo dependem de interações futuras, que normalmente não estão disponíveis em aplicações do mundo real, limitando sua usabilidade. Abordar esses desafios é crucial para melhorar a escalabilidade, a interpretabilidade e a eficácia dos modelos de KT em sistemas educacionais de grande escala.
O DKT2: Um Novo Modelo de Rastreamento de Conhecimento
Pesquisadores da Universidade de Zhejiang propõem o DKT2, uma nova estrutura de KT baseada em aprendizado profundo que utiliza a arquitetura xLSTM para superar as limitações dos métodos anteriores. O DKT2 difere dos modelos anteriores, pois utiliza o Modelo de Rasch para melhorar a representação de entrada e incorpora a Teoria de Resposta ao Item (IRT) para uma maior interpretabilidade. Ao identificar conhecimento familiar e desconhecido, o DKT2 oferece uma melhor representação do estado de aprendizado dos alunos.
A Arquitetura do DKT2
O DKT2 adota um pipeline de aprendizado sistemático com incorporação de Rasch para registrar interações entre alunos e questões e incluir níveis de dificuldade para uma melhor representação de entrada. Os blocos xLSTM usam sLSTM e mLSTM para facilitar uma melhor retenção de memória, otimização de paralelização e atualização dinâmica de conhecimento. O módulo de previsão IRT e decomposição de conhecimento separa conhecimento familiar e desconhecido para permitir um rastreamento de conhecimento mais interpretável.
Experimentos e Resultados
Experimentos extensivos em três conjuntos de dados de grande escala demonstram que o DKT2 consistentemente supera 17 modelos de linha de base em várias tarefas de previsão, incluindo previsões de um passo, multi-passo e de comprimento de história variável. Ele alcança maior precisão, AUC e menor RMSE em comparação com modelos sequenciais profundos, como o DKT, e modelos baseados em atenção, como o AKT.
Conclusão
O DKT2 é um avanço no rastreamento de conhecimento, combinando xLSTM, o Modelo de Rasch e a IRT para alcançar um equilíbrio perfeito entre precisão preditiva e usabilidade no mundo real. Por meio da geração de estados de conhecimento interpretáveis e do aprendizado paralelizado e de economia de memória, o método garante escalabilidade e personalização aprimorada em aplicações de ITS. Áreas de trabalho futuro incluem estender a aplicabilidade do DKT2 para conjuntos de dados ultra-grandes e melhorar sua capacidade de previsão multi-conceito para melhor apoiar sistemas de aprendizado adaptativo. Com o DKT2, é possível criar sistemas de tutoria inteligentes mais eficazes e personalizados, melhorando a experiência de aprendizado dos alunos e aumentando a eficiência dos professores.