
Sistemele de IA antrenate prin RLHF sunt recompensate sistematic pentru producerea de rezultate care obțin un scor bun în ceea ce privește preferințele umane medii — ceea ce, din punct de vedere matematic, le împinge către mediocritate creativă. Acest articol definește capcana B+, identifică RLHF ca mecanism structural și propune un cadru Rebel AI bazat pe căutarea noutății, agenți divergenți adversari și feedback metacognitiv.