Wie knacke ich die KI?

Der KI-Podcast

Jeder, der schon mal mit KI-Sprachmodellen zu tun hatte, kennt es: man will eine bestimmte Antwort vom Chatbot - doch der weigert sich hartnäckig, diese zu geben. Es gibt aber Tricks, um LLMs und andere GenAI-Modelle gefügig zu machen: sogenannte Pompt Hacks, Jailbreaks oder Prompt Injections. Wir erklären, was hinter diesen Begriffen steckt, wie diese Methoden funktionieren und wir fragen: Ist es gut oder schlecht, wenn KI-Modelle nicht alle Fragen beantworten, die wir ihnen stellen? In dieser Folge: 00:00 Intro 02:38 Was sind Prompt Hacks und wie funktionieren sie? 13:30 Wie Marie einen Chatbot dazu brachte, ihr 3000 Proteinriegel zu versprechen 19:47 Fritz und DeepSeek: Wer bestimmt, was KI-Modelle sagen? 30:10 Sollen Chatbots immer auf alle Fragen Antworten geben? 34:32 Was haben wir diese Woche mit KI gemacht? Redaktion und Mitarbeit: David Beck, Cristina Cletiu, Chris Eckardt, Fritz Espenlaub, Marie Kilg, Mark Kleber, Gudrun Riedl, Christian Schiffer, Gregor Schmalzried Links und Quellen: - Chevrolet of Watsonwille verkauft Chevy Tahoe für $1 https://www.theautopian.com/chevy-dealers-ai-chatbot-allegedly-recommended-fords-gave-free-access-to-chatgpt/ - Findet man in LLMs gefährlichere Informationen zu Biowaffen als in Google? https://www.rand.org/pubs/research_reports/RRA2977-2.html - Der chinesische Chatbot DeepSeek und das Tiananmen-Massaker: https://www.linkedin.com/posts/peter-gostev_it-took-some-effort-but-i-managed-to-get-activity-7152042996635521024-2hBZ/ - KI macht Job-Interviews: https://www.micro1.ai/gpt-vetting - Airline haftet für Fehler ihres Chatbots: https://www.theguardian.com/world/2024/feb/16/air-canada-chatbot-lawsuit - Maries Theaterstück: Anna und Eve in der Neuköllner Oper https://www.neukoellneroper.de/performance/anna-eve/ - Was steckt hinter dem mysteriösen neuen Chatbot GPT2? https://news.ycombinator.com/item?id=40199715 https://arstechnica.com/information-technology/2024/04/rumors-swirl-about-mystery-gpt2-chatbot-that-some-think-is-gpt-5-in-disguise/ Kontakt: Wir freuen uns über Fragen und Kommentare an podcast@br.de. Unterstützt uns: Wenn euch dieser Podcast gefällt, freuen wir uns über eine Bewertung auf eurer liebsten Podcast-Plattform. Abonniert den KI-Podcast in der ARD Audiothek oder wo immer ihr eure Podcasts hört, um keine Episode zu verpassen. Und empfehlt uns gerne weiter!