Carte albă

Capcana B+: Cum AI comprimă spectrul creativ

Sistemele de IA antrenate prin RLHF sunt recompensate sistematic pentru producerea de rezultate care obțin un scor bun în ceea ce privește preferințele umane medii — ceea ce, din punct de vedere matematic, le împinge către mediocritate creativă. Acest articol definește capcana B+, identifică RLHF ca mecanism structural și propune un cadru Rebel AI bazat pe căutarea noutății, agenți divergenți adversari și feedback metacognitiv.

DOI:
10.13140/RG.2.2.10486.46403
Acesta este un text în interiorul unui bloc div.

Titlul publicației