Diese Woche veröffentlichten Google-Forscher ein Papier, das die Ergebnisse von a künstliche Intelligenz (AI)-Tool zum Erstellen von Musik.
Das Tool mit dem Namen MusicLM ist nicht das erste KI-Musikinstrument, das auf den Markt kommt. Die von Google bereitgestellten Beispiele demonstrieren jedoch musikalische Kreativität, die auf einer begrenzten Anzahl beschreibender Wörter basiert.
Künstliche Intelligenz zeigt, wie komplexe Computersysteme darauf trainiert wurden, sich menschenähnlich zu verhalten.
Werkzeuge wie GPT-Chat kann schnell schriftliche Dokumente erstellen oder generieren, die sich gut mit der Arbeit von Menschen vergleichen lassen. ChatGPT und ähnliche Systeme erfordern leistungsstarke Computer, um komplexe maschinelle Lernmodelle auszuführen. Das Unternehmen mit Sitz in San Francisco KI öffnen startete ChatGPT Ende letzten Jahres.
Entwickler trainieren solche Systeme mit riesigen Datenmengen, um zu lernen, wie sie verschiedene Formen von Inhalten nachbilden können. Beispielsweise können computergenerierte Inhalte schriftliches Material, Designelemente, Kunst oder Musik umfassen.
ChatGPT hat in letzter Zeit viel Aufmerksamkeit für seine Fähigkeiten erhalten komplexe Skripte generieren und andere Inhalte aus einer einfachen Beschreibung in natürlicher Sprache.
MusicLM von Google
Google-Ingenieure erklären das MusicLM-System wie folgt:
Zuerst denkt sich ein Benutzer ein oder mehrere Wörter aus, die die Art von Musik beschreiben, die das Tool erstellen soll.
Beispielsweise könnte ein Benutzer diesen kurzen Satz in das System eingeben: “eine kontinuierliche, beruhigende Geige, begleitet von einem sanften Gitarrenklang.” Die eingegebenen Beschreibungen können unterschiedliche Musik beinhalten Stilevorhandene Instrumente oder andere Sounds.
Mehrere verschiedene Musik Beispiele produziert von MusicLM wurden online veröffentlicht. Ein Teil der generierten Musik stammte aus nur Ein- oder Zwei-Wort-Beschreibungen wie „Jazz“, „Rock“ oder „Techno“. Das System erstellte weitere Beispiele aus detaillierteren Beschreibungen, die ganze Sätze enthielten.
In einem Beispiel schließen Google-Forscher diese ein Anweisungen zu MusicLM: „Der Hauptsoundtrack einer Spielzimmer Spiel. Es ist schnell und optimistisch, mit einem eingängigen E-Gitarren-Riff. Musik ist sich wiederholend und leicht zu merken, aber mit unerwarteten Geräuschen…“
In der resultierenden Aufnahme scheint sich die Musik sehr nah an der Beschreibung zu halten. Das Team sagte, je detaillierter die Beschreibung ist, desto besser kann das System versuchen, sie zu erstellen.
Das MusicLM-Modell funktioniert ähnlich wie die von ChatGPT verwendeten maschinellen Lernsysteme. Solche Tools können menschenähnliche Ergebnisse liefern, weil sie mit riesigen Datenmengen trainiert werden. Viele verschiedene Materialien werden in Systeme eingespeist, damit sie komplexe Fähigkeiten erlernen können, um realistische Werke zu erstellen.
Zusätzlich zur Generierung neuer Musik aus schriftlichen Beschreibungen kann das System laut dem Team auch Beispiele erstellen, die auf dem Gesang einer Person basieren. summenpfeifen oder ein Instrument spielen.
Die Forscher sagten, das Instrument „produziert qualitativ hochwertige Musik … für mehrere Minuten, während es ist treu zum Textkonditionierungssignal.“
Derzeit hat das Google-Team die MusicLM-Vorlagen nicht für die öffentliche Nutzung freigegeben. Dies unterscheidet sich von ChatGPT, das Benutzern im November online zum Experimentieren zur Verfügung gestellt wurde.
Google gab jedoch bekannt, dass dies der Fall war loslassen ein “hochwertiger Datensatz” von über 5.500 Musikschreibpaaren, die von professionellen Musikern namens MusicCaps erstellt wurden. Die Forscher gingen diesen Schritt, um bei der Entwicklung anderer KI-Musikgeneratoren zu helfen.
MusicLM-Forscher sagten, sie glauben, dass sie ein neues Tool entwickelt haben, das jedem hilft, schnell und einfach eine qualitativ hochwertige Musikauswahl zu erstellen. Das Team sagte jedoch, dass es auch einige Risiken im Zusammenhang mit dem maschinellen Lernprozess erkennt.
Eines der Hauptprobleme, das von den Forschern identifiziert wurde, war die „Voreingenommenheit in den Trainingsdaten“. Eine Voreingenommenheit kann zu viel von einer Seite und zu wenig von der anderen umfassen. Die Forscher sagten, dies werfe eine Frage „über Angemessenheit zur Musikerzeugung für Kulturen, die in Bildungsdaten unterrepräsentiert sind.“
Das Team sagte, es plane, alle Systemergebnisse, die in Betracht gezogen werden könnten, weiter zu untersuchen kulturelle Aneignung. Das Ziel wäre es, Verzerrungen durch mehr Entwicklung und Tests zu begrenzen.
Darüber hinaus sagten die Forscher, dass sie das System weiter verbessern würden, um Textgenerierung, Textkonditionierung und eine bessere Sprach- und Musikqualität einzubeziehen.
Ich bin Bryan Lynn.
Bryan Lynn schrieb diese Geschichte für VOA Learning English, basierend auf Google-Berichten.
____________________________________________________________
Wörter in dieser Geschichte
künstliche Intelligenz – n. die Entwicklung von Computersystemen, die in der Lage sind, Aufgaben auszuführen, die normalerweise menschliche Intelligenz erfordern
Stil -n. eine bestimmte Form oder ein bestimmtes Design, das normalerweise zum Vergleich von Kunstformen oder Artefakten verwendet wird
Anweisung -n. eine Beschreibung, wie etwas zu tun ist
Spielzimmer – n. ein Bereich mit vielen elektronischen und anderen münzbetriebenen Spielen
optimistisch – adj. voller Hoffnung und Glück
sich wiederholend – adj. immer wieder etwas sagen oder tun
summen – v. einen musikalischen Ton machen, ohne den Mund zu öffnen
Pfeife – v.tr. um einen hohen Ton zu erzeugen, indem Luft durch ein kleines Loch im Mund gepresst wird
treu – adj. auf einer Idee oder Überzeugung fest stehen
angemessen – adj. der Grad, in dem etwas für eine Situation richtig ist
kulturelle Aneignung – nein. wenn Mitglieder einer Kultur in einer Gesellschaft, oft der Mainstream-Kultur, eine Praxis einer anderen, oft Minderheitenkultur anwenden, ohne die Bedeutung oder Wichtigkeit der Praxis vollständig zu verstehen.
_______________________________________________________________
Was haltet ihr von dieser Geschichte? Wir wollen von dir hören. Wir haben ein neues Kommentarsystem. So funktioniert das:
- Schreiben Sie Ihren Kommentar in das Feld.
- Unterhalb der Box sehen Sie vier Bilder für Social-Media-Konten. Sie sind für Disqus, Facebook, Twitter und Google.
- Klicken Sie auf ein Bild und ein Feld erscheint. Geben Sie den Login für Ihr Social-Media-Konto ein. Oder Sie können eine im Disqus-System erstellen. Es ist der blaue Kreis mit dem „D“ darauf. Es ist kostenlos.
Wann immer Sie zurückkommen, um auf der Seite „Englisch lernen“ einen Kommentar abzugeben, können Sie Ihr Konto verwenden und Ihre Kommentare und Antworten sehen. Unsere Kommentarrichtlinie ist hier.