[1]

A. Aderinokun, “Unified Multimodal Transformers: Improving Vision-Language Models with Knowledge-Guided Attention Mechanisms”, MZJAI, vol. 1, no. 2, Sep. 2024.