Welche Aufgaben können mit eigenen KI-Agenten automatisiert werden. Welche Anpassen sind notwendig, um die Kommunikation mit fremden KI-Agenten zu optimieren

KI-Agenten aus zwei unterschiedlichen Perspektiven betrachten

Unternehmen müssen das Thema KI-Agenten aus zwei unterschiedlichen Perspektiven betrachten. Einerseits geht es darum, welche Aufgaben Mitarbeitende bereits heute mit KI-Agenten wie beispielsweise ChatGPT Tasks oder Operator automatisieren können. Andererseits stellt sich die Frage, welche Anpassungen auf der Unternehmenswebsite notwendig sind, um die Interaktion mit KI-Agenten entweder zu optimieren oder um sie gezielt zu unterbinden.

Was sind überhaupt KI-Agenten?

In den letzten zwei Jahren haben viele Unternehmen unterschiedliche generative KI-Modelle beobachtet, getestet und auch eingesetzt: zum Beispiel KI-Texterstellung, KI-Bilderstellung, KI-Videoerstellung. Je nachdem, was eine KI generieren soll, wird ein spezifischer Algorithmus, Machine Learning oder ein neuronales Netz eingesetzt. So kann eine KI die spezifische Aufgabe schneller erledigen als jeder Mensch. Aber eben nur diese eine spezifische Aufgabe. Für eine andere Aufgabe wird ein anderer spezifischer Algorithmus, Machine Learning oder ein neuronales Netz benötigt. KI-Agenten kombinieren nun unterschiedliche KI-Technologien. So können KI-Agenten eine ganze Reihe von unterschiedlichen Aufgaben in der richtigen Abfolge durchführen.

Der Screenshot zeigt einen Ausschnitt des Bildschirms, der darstellt, welche Version von ChatGPT man nutzt. Die Betaversion der Funktionalitäten von ChatGPT Tasks nennt sich in Deutschland „GPT-4o mit geplanten Aufgaben“.
Was sind ChatGPT Tasks?

ChatGPT Tasks ist eine – zurzeit noch – experimentelle Funktion, mit der Aufgaben (Tasks) als Prompt eingegeben und durchgeführt werden können. Die Funktion ähnelt zunächst sehr der Aufgabenfunktion in Onlinekalendern wie beispielsweise Outlook. Doch es ist nicht nur eine Erinnerungsfunktion für wiederkehrende Aufgaben. ChatGPT Tasks kombiniert die Aufgabenfunktion mit dem, was das sogenannte große Sprachmodell hinter ChatGPT – aktuell die GPT-4-Serie von OpenAI – am besten kann: Contents recherchieren und erstellen.

Beispiel-Prompts:

  1. Erstelle mir täglich drei Vorschläge für Beiträge, die ich auf LinkedIn zum <<Thema XY>> posten kann – mit je zwei Bildvorschlägen.
  2. Informiere mich sobald <<Marktbegleiter XY>> eine neue Pressemeldung herausgibt.
  3. Sende mir täglich drei Übungen, die ich zur Stärkung meiner <<XY Muskulatur>> machen kann.

Anfang 2025 hat OpenAI sein ChatGPT Tasks vorgestellt. ChatGPT Tasks vollzieht schon die ersten Schritte in Richtung eines vollwertigen KI-Agenten, weil die gestellten Aufgaben aus mehreren Schritten bestehen.

Schritte zur Erfüllung der Aufgabe von Beispiel-Prompt 1:

  • Recherche von aktuellen Informationen zum <<Thema XY>>
  • Erstellung von drei Blogbeiträgen, wie sie typischerweise auf LinkedIn veröffentlicht werden
  • Erstellen von je zwei Bildvorschlägen zu den drei Blogbeiträgen
  • Senden der täglichen Vorschläge per E-Mail

Die Erstellung von sich wiederholenden Tasks kann viel Zeit sparen oder helfen, sich besser zu organisieren. Tasks ist bereits als Betaversion in Deutschland verfügbar – wenn man einen Plus-Account für 20 $ oder einen geschäftlichen Team-Account für 25 $ pro Monat hat. [Stand: 04/2025]

Was kann der ChatGPT Operator?

ChatGPT Operator ist das neueste Feature von OpenAI. Es ist in Deutschland noch nicht offiziell verfügbar. Der Operator lässt sich aber bereits nutzen, wenn man über einen seriösen VPN-Anbieter einen amerikanischen Internet-Zugang simuliert und den Pro-Account für 200 $ pro Monat abonniert hat. ChatGPT Operator ist eine erweiterte Version für Unternehmen, die spezielle Tools, Schnittstellen und Funktionen für die Automation von Aufgaben nutzen möchten.

So kann der Operator Webseiten wie ein Mensch bedienen. Er kann – wenn man ihm einmal die Anmeldung zur eigenen Website gegeben hat – beispielsweise die Website pflegen: Dateien öffnen, alternative Bildbeschreibungen oder SEO-Texte einfügen, speichern usw. Das erspart einem Web-Content-Manager viel klicken, warten und wieder klicken.

Der Operator kann sich aber auch auf anderen Webseiten bewegen: klicken, scrollen und Formulare ausfüllen. Der Operator pausiert nur, wenn Logins oder die Bestätigung eines CAPTCHA erforderlich sind. Hier muss er rein rechtlich manuell von einem Menschen unterstützt werden. Logins, die einmal eingegeben wurden, merkt sich das System.

Der Screenshot zeigt einen Ausschnitt des Bildschirms, der darstellt, welche Version von ChatGPT man nutzt. Die Betaversion der Funktionalitäten von ChatGPT Operator ist in Deutschland noch nicht offiziell verfügbar.

Beispiel-Prompts und angestoßene Abläufe:

  1. Finde ein libanesisches Restaurant in Frankfurt am Main, Deutschland, und reserviere einen Tisch für fünf Personen zum Business-Lunch für <<XY Datum>>, <<XY Uhrzeit, Central Europe Time>>
  • Der Operator durchsucht jetzt Plattformen wie beispielsweise OpenTable und zeigt Reservierungs-Optionen an, die dann manuell bestätigt werden müssen. Diese Aufgabe kann vom Operator sehr schnell ausgeführt werden, da nur eine Plattform durchsucht werden muss. Es werden aber nur Restaurants berücksichtig, die OpenTable als Reservierungsplattform nutzen.
  1. Alternativ: Durchsuche Websites von Restaurants in Frankfurt am Main, Deutschland. Zeige mir Restaurants mit libanesischer Küche, die eine Online-Reservierungs-Option und einen Tisch für fünf Personen zum Business-Lunch für <<XY Datum>>, <<XY Uhrzeit, CET>> haben.
  • Der Operator durchsucht jetzt die Webseiten von Restaurants in Frankfurt. Zeigt Reservierungs-Optionen an, die dann manuell zu bestätigen sind.
    Diese Aufgabenstellung dauert deutlich länger, weil einzelne Webseiten von Restaurants in Frankfurt durchsucht werden müssen. Es werden gegebenenfalls aber deutlich mehr Restaurants gefunden.
  1. Erstelle eine Liste mit fünf Unternehmen in Hessen, die eine Stelle auf der HR-Plattform Indeed für einen <<Innovations-Manager m/w/d>> ausgeschrieben haben. Finde im Impressum die Geschäftsführer zu den Unternehmen heraus und liste Unternehmen, Ansprechpartner, Anschriften und zentrale Telefonnummern in einer Excel-Liste auf.
    Das Durchsuchen von indeed geht schnell. Das Befüllen der Excel-Liste dauert etwas länger. Und wenn man deutlich mehr Adressen haben möchte, bricht der Operator gegebenenfalls auch die Aufgabe ab.

Der Operator arbeitet mit vorgefertigten KI-Agenten für die Kategorien „Essen und Veranstaltungen“, „Essenslieferungen“, „Lokale Dienstleistungen“, „Einkäufe“, „Reisen“ und „News“. Diese Rubriken sind momentan für den amerikanischen Sprachraum ausgelegt, funktionieren aber zum Teil auch für Deutschland. Es gibt auch nur eine Auswahl von Partner-Webseiten, auf denen man zum Beispiel Präferenzen für Flüge, Unterkünfte oder Essen hinterlegen kann. Zu den Partner-Webseiten die auch in Deutschland funktionieren, gehören beispielsweise Airbnb, Booking.com, Etsy, OpenTable, Tripadvisor, Uber und UberEats.

Datenschutz und -sicherheit

Jeder Schritt, den der Operator ausführt, wird live angezeigt und in der Aufgaben-Historie aufgelistet. Damit ist der Operator keine Blackbox, denn die Schritte bleiben nachvollziehbar. Das hilft auch bei der Suche nach Fehlern oder der Optimierung der Prompts. Eine mögliche Fehlerquelle kann beispielsweise bei der Übersetzung der deutschen Quellen oder bei unterschiedlichen Zeitzonen liegen. Über den Button „Take Control“ haben Anwender jederzeit die Möglichkeit, selbst die Kontrolle zu übernehmen.

Der Operator ist benutzerfreundlich, da Mitarbeitende kein technisches Know-how benötigen, um Abläufe zu automatisieren. Allerdings muss es im Unternehmen zum Beispiel durch eine KI-Richtlinie erlaubt sein, überhaupt mit KI-Agenten zu arbeiten und gegebenenfalls benötigte Logins einzugeben. Der Operator arbeitet in einer kontrollierten virtuellen Umgebung, in der die Daten geschützt sind. Dennoch sollte die IT-Abteilung involviert werden. Denn diese Version von ChatGPT Operator erstellt für das Training von jedem Schritt einen Screenshot. In den Settings gibt es allerdings eine Privacy-Einstellung, mit der sich das Modell-Training ausschalten lässt. Während ein Mitarbeitender die Kontrolle übernimmt, werden auf keinen Fall Screenshots erstellt, weil hier meist Zugangsdaten eingegeben werden. [Stand: 04/2025]

Zwischen-Fazit: KI-Agenten im Einsatz für die Automatisierung von Aufgaben

ChatGPT Tasks und Operator sind noch keine fertigen KI-Agenten. Unternehmen können aber bereits das Potenzial erahnen, was sich in Zukunft mit KI-Agenten alles automatisierbar sein wird. KI-Agenten haben zudem Auswirkungen auf Geschäftsmodelle: Adressdatenbanken werden beispielsweise durch KI-Agenten an Bedeutung verlieren. Es sei denn, die Anbieter setzen selbst ChatGPT Operator oder andere KI-Modelle ein.

Für welche Aufgaben wollen Sie KI-Agenten einsetzen?

Wie sich Unternehmen auf den neuen Kommunikationskanal vorbereiten

Durch die Nutzung von KI und KI-Agenten entwickelt sich ein weiterer wichtiger Kommunikationskanal, den Unternehmen für sich nutzen können. Unternehmen müssen sich jetzt entscheiden, ob und wie sie diesen neuen zusätzlichen Kanal aktiv unterstützen wollen oder ob sie sich ihm bewusst entziehen möchten. Denn die Fähigkeit, mithilfe von KI die Informationen einer Website nutzen zu können, hängt von mehreren Faktoren ab.

Website-Typen und die Zugänglichkeit für KI-Agenten

Websites, die ohne Anmeldung oder spezielle Berechtigungen aufgerufen werden können, sind für KI-Agenten leicht zugänglich. Dazu zählen beispielsweise öffentlich zugängliche Nachrichtenseiten wie Wikipedia, Blogs oder Unternehmenswebsites. Webseiten, die eine klare HTML-Struktur haben und deren Inhalte statisch abrufbar sind, funktionieren für KI-Agenten generell besser.

Geschützte Seiten, die eine Login-Pflicht, eine Bezahlschranke, einen CAPTCHA oder eine IP-Blockade haben, sind nicht direkt zugänglich. Das sind beispielsweise Online-Zeitungen mit Bezahl-Inhalten hinter einer Paywall; E-Books/Whitepaper, die für Content-Marketing genutzt werden und nur gegen die Angabe von Daten heruntergeladen werden können; interne Unternehmenswebsites (Intranets) oder auch private Social-Media-Profile. Bei Facebook und LinkedIn kann man zum Beispiel einstellen, ob das eigene Profil ein geschütztes oder ein öffentlich zugängliches sein soll.

Darüber hinaus gibt es dynamische Websites, die stark von JavaScript abhängen und schwer auslesbar sind. Aber auch die Inhalte von Websites, die Java-Frameworks verwenden wie zum Beispiel React, Angular, Vue.js, sind schwer zu analysieren, weil Inhalte oft erst nachträglich geladen werden. Netflix oder Spotify sind zum Beispiel nicht auslesbar, weil ihre Inhalte dynamisch und/oder geschützt sind. Und bei Websites etwa von Banken blockieren zusätzliche Sicherheitsmaßnahmen automatisierte Zugriffe – dazu zählen CAPTCHAs, Firewalls oder auch spezielle Schutzsysteme wie zum Beispiel Cloudflare.

Es gibt auch Websites, die das Scraping oder die Indexierung durch Bots in den Bestimmungen der robots.txt-Datei steuern. In der robots.txt-Datei wird angegeben, wie die Daten auf einer Site genutzt werden dürfen. Das ist allerdings nur eine Richtlinie und bietet keinen wirklichen Schutz der Daten. Viele Plattformen haben zudem API-Zugriffsbegrenzungen. Selbst wenn der Zugriff prinzipiell über die API erlaubt ist, kann der Zugang bei ungewöhnlich vielen Anfragen gesperrt werden.

Das KI-generierte Bild zeigt links einen Mann und rechts eine Frau, die Rücken an Rücken stehen. Sie haben die Arme verschränkt und blicken ernst in entgegengesetzte Richtungen. Die beiden sportlichen Menschen sind in schwarz gekleidet und heben sich nur wenig vom schwarzen Hintergrund ab. Das Bild trägt den Titel: KI-Agenten im Auftrag von Unternehmen.

Checkliste: SEO für KIs

KI-Agenten können Informationen am besten nutzen, wenn sie klar strukturiert und maschinenlesbar bereitgestellt werden. Hier sind einige konkrete Maßnahmen, um Websites KI-freundlicher zu gestalten:

  1. Klare und strukturierte Inhalte
    – Die Verwendung von einfacher Sprache unterstützt auch das Verständnis von KI-Agenten. Natürlich kann KI prinzipiell auch komplexe Sätze verstehen. Um sicherzugehen, dass es keine Fehlinterpretationen gibt, ist aber eine klare und direkte Sprache besser.
    – Die Nutzung logischer Überschriften (H1, H2, H3) sollten auch die gewünschte Struktur des Inhalts widerspiegeln.

– Darüber hinaus helfen Bullet Points und besonders auch Tabellen bei der schnellen Extraktion von Informationen.

  1. Maschinenlesbare Formate

– Schema-Markup [Schema-Markup] – auch als strukturierte Daten bekannt – ist das semantische Vokabular, das Suchmaschinen verwenden, um den Inhalt einer Seite zu charakterisieren und zu kategorisieren. Die Verwendung von beispielsweise JSON-LD, Microdata, RDFa hilft KI-Agenten, Inhalte besser zu interpretieren.

– APIs und RSS-Feeds gewähren den direkten Zugriff auf Daten und verhindern damit Missverständnisse, die beim Scraping auftreten können.

  1. Aktualität und Konsistenz

– Die Verwendung von Meta-Daten und einem eindeutigen Veröffentlichungsdatum zeigen den KI-Agenten, welche Informationen aktuell sind.

– Eine konsistente Terminologie – die einheitliche Nutzung von Begriffen – erleichtert KI-Agenten zudem die Verarbeitung.

  1. Technische Performance und Zugänglichkeit

– Je schneller eine Seite geladen werden kann, desto effizienter ist die Verarbeitung durch KI-Agenten. Es kommt deutlich seltener zu Abbrüchen.

– Die Optimierung einer Website für die mobile Nutzung stellt sicher, dass KI-Agenten Websites auch über mobile Endgeräte auslesen können.

– Inhalte, die nur durch Skripte geladen werden, können für KI schwer zugänglich sein. Deshalb ist die Nutzung von Java-Script kritisch.

  1. Offenheit für KI-Crawler fördern

– Wenn die robots.txt richtig konfiguriert ist, erlaubt sie einem KI-Crawler den Zugriff und blockiert ihn nicht.

– KI-spezifische XML-Sitemaps oder die Verwendung von APIs kann Bots beim Auslesen von Websites helfen.

Fazit

KI-Agenten stehen zurzeit noch am Anfang ihrer Entwicklung, sind aber bereits einsetzbar.  Es ist abzusehen, dass sie sich sehr schnell etablieren werden. Denn sie sparen für Unternehmen Zeit und helfen ihnen, durchaus komplexe Aufgaben zu automatisieren.

Für Unternehmen ist es darum wichtig, jetzt eine entsprechende Strategie zu entwickeln. Sie müssen klären, welche Informationen sie besonders leicht für KI-Agenten anderer Unternehmen zugänglich machen wollen und welche besser nicht. Diese Strategie muss auch festlegen, welche Informationen nach wie vor für Menschen spannend sind und welche nur für Maschinen.

Webseiten lassen sich auch weitgehend vor dem Zugriff durch KI-Systeme schützen. Häufig wird es allerdings sinnvoller sein, Maßnahmen zu ergreifen, um die Zugänglichkeit der eigenen Website für KI-Systeme zu verbessern. Zudem ist es möglich, auf einer Plattform oder der Unternehmenswebsite extra aufbereitete Daten für KI-Agenten bereitzustellen – als besondere Datei oder in Tabellenform. Ebenso denkbar ist es, dass Unternehmen eine API für das Auslesen bestimmter Informationen auf ihrer Website zur Verfügung stellen. Denn den KI-Agenten gehört die Zukunft. Ihre Besuche auf der eigenen Website könnten schon bald ähnlich wertvoll werden wie die menschlicher Unternehmenskunden.

Ist Ihre Website schon auf KI-Agenten vorbereitet?