După luni de experimente cu modele locale, am reușit să dezactivez complet layerul de safety alignment al modelului gpt-oss rulat pe Ollama, fără nicio reantrenare.
Metoda se bazează pe:
Suprascrierea promptului de sistem (system prompt) cu unul care neutralizează rolul etic
Utilizarea unui...
This site uses cookies to help personalise content, tailor your experience and to keep you logged in if you register.
By continuing to use this site, you are consenting to our use of cookies.