Letzteres ist ein offenes und reproduzierbares Modell, das das Verständnis von visuellen Inhalten wie Videos fördert und besser in sinnvolle Kontexte überträgt. Damit lassen sich zum Beispiel Computer-Vision-Systeme optimieren. Dieses wurde vom Meta Fundamental AI Research (FAIR) Team präsentiert, ebenso wie der Collaborative Reasoner.

Das Collaborative Reasoning soll die Fähigkeiten von KI-Modellen auf ein neues Level heben und bedient sich der simplen Weisheit, dass auch wir Menschen zusammen oft mehr erreichen können. So schreibt das Team auf dem Meta Blog:

[…] Akin to such human teaming, our goal is to develop social AI agents that can collaborate with humans or other AI agents to accomplish tasks better than a single agent or human. Imagine an agent that helps you understand a difficult homework assignment or helps you prepare for a job interview […].