19.12.2023 Aufrufe

OCG Journal 4/23 Zukunftsmusik - Der Einfluss der Künstlichen Intelligenz in der Musik

Wie verändert KI die Musikindustrie? Wie viel Gewicht geben wir künstlicher Kreativität? Welche Möglichkeiten entstehen durch KI in der Kunst und mit welchen technischen Anwendungen beschäftigen sich österreichische Musikwissenschaftler*innen? Die Mitgliederzeitschrift der Österreichischen Computer Gesellschaft (OCG) widmet sich stets einem Schwerpunktthema, diesmal: KI und Musik.

Wie verändert KI die Musikindustrie? Wie viel Gewicht geben wir künstlicher Kreativität? Welche Möglichkeiten entstehen durch KI in der Kunst und mit welchen technischen Anwendungen beschäftigen sich österreichische Musikwissenschaftler*innen? Die Mitgliederzeitschrift der Österreichischen Computer Gesellschaft (OCG) widmet sich stets einem Schwerpunktthema, diesmal: KI und Musik.

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

weise nicht unähnlich zu jener Methodik<br />

ist, welche <strong>in</strong> <strong>der</strong> Komponist*<strong>in</strong>nen-Ausbildung<br />

verwendet wird (Harmonielehre<br />

und Kontrapunkt). Bemerkenswert ist,<br />

dass <strong>der</strong>/die User*<strong>in</strong> bei Constra<strong>in</strong>ts Programm<strong>in</strong>g<br />

nicht e<strong>in</strong>en konstruktiven<br />

Weg angeben muss, WIE man zum gewünschten<br />

Ergebnis kommt. Das System<br />

f<strong>in</strong>det selbst – durch Permutieren – e<strong>in</strong>e<br />

Lösung. In diesem S<strong>in</strong>ne wirken Expert<br />

Systems „<strong>in</strong>telligent“. An<strong>der</strong>erseits ist diese<br />

Vorgangsweise durchaus transparent.<br />

<strong>Der</strong> Mensch ist durch das Aufstellen <strong>der</strong><br />

Regeln für das Ergebnis verantwortlich<br />

und die Beschaffenheit <strong>der</strong> Ergebnisse ist<br />

nachvollziehbar und überprüfbar.<br />

NEURONALE NETZE –<br />

ERGEBNISSE NICHT MEHR<br />

NACHVOLLZIEHBAR<br />

Bei aktuellen KIs aus künstlichen neuronalen<br />

Netzen ist das eher nicht <strong>der</strong> Fall.<br />

Durch viele tausend Tra<strong>in</strong><strong>in</strong>gsdurchgänge<br />

sedimentiert sich e<strong>in</strong>e Art von statistischem<br />

Wissen im Netzwerk, wie man von<br />

Fragen zu Antworten kommt. Wie aber<br />

e<strong>in</strong>e spezielle Antwort zustande kam, ist<br />

kaum nachvollziehbar. Bei Inputs, welche<br />

von den Tra<strong>in</strong><strong>in</strong>gsdaten nicht gut abgedeckt<br />

wurden, führt das möglicherweise<br />

zu Antworten, welche durch Interpolation<br />

zwischen denen <strong>der</strong> Tra<strong>in</strong><strong>in</strong>gsdaten<br />

liegen. Dabei ist zu bedenken, dass<br />

es Gebiete gibt, wo dieses Interpolieren<br />

S<strong>in</strong>n macht (z. B. Handschrifterkennung),<br />

während es <strong>in</strong> an<strong>der</strong>en Bereichen problematisch<br />

ist. In tonaler <strong>Musik</strong> s<strong>in</strong>d z. B.<br />

parallele Qu<strong>in</strong>t-, Oktav- und Prim-Intervalle<br />

verboten, parallele Terzen und Sexten<br />

beliebt, und gewisse parallele Intervallfortschreitungen<br />

kommen aus an<strong>der</strong>en<br />

Gründen nicht <strong>in</strong> Frage (Dissonanzen).<br />

Bei <strong>der</strong> Frage, ob e<strong>in</strong> Intervall parallel geführt<br />

werden darf, wäre die Interpolation<br />

zwischen Beispielsdaten also fatal, weil <strong>in</strong><br />

dieser Doma<strong>in</strong>e sehr diskrete, nicht <strong>in</strong>terpolierbare<br />

Pr<strong>in</strong>zipien herrschen.<br />

EIN EXPERIMENT<br />

Folgendes Experiment hat <strong>der</strong> Autor<br />

selbst durchgeführt. Dabei wurde <strong>in</strong><br />

ChatGPT4 folgen<strong>der</strong> Prompt e<strong>in</strong>gegeben:<br />

Hi ChatGPT, I would like you to help me<br />

and my colleagues with an artistic performance.<br />

Can you create a structure for<br />

this performance. There are 3 performers<br />

<strong>in</strong>volved: Soroosh is play<strong>in</strong>g a traditional<br />

Iranian <strong>in</strong>strument called setar, and also<br />

another electric setar. He is also s<strong>in</strong>g<strong>in</strong>g,<br />

requir<strong>in</strong>g lyrics for this. Mahdieh is a visual<br />

artist, and Johannes is play<strong>in</strong>g live<br />

electronics. The performance should last<br />

8 m<strong>in</strong>utes <strong>in</strong> total. Soroosh can play on<br />

his <strong>in</strong>strument <strong>in</strong> various styles, rang<strong>in</strong>g<br />

from traditional Iranian music over rock<br />

music to very experimental avant-garde<br />

style. He can switch between setar and<br />

electric setar and also s<strong>in</strong>g to lyrics given<br />

to him by you. Mahdieh will do live charcoal<br />

draw<strong>in</strong>g dur<strong>in</strong>g the performance<br />

on a canvas. The canvas will also have<br />

contact microphones captur<strong>in</strong>g sound<br />

from the actions from Mahdieh‘s pa<strong>in</strong>t<strong>in</strong>g.<br />

Johannes will play live electronics,<br />

either by captur<strong>in</strong>g and transform<strong>in</strong>g<br />

the sounds of Soroosh and/or Mahdieh<br />

with various electronic effects, but he<br />

can also play sound files with any k<strong>in</strong>d<br />

of sound and/or music. Please generate<br />

a structure <strong>in</strong> several sections, tell<strong>in</strong>g,<br />

what each performer should do <strong>in</strong> which<br />

section, def<strong>in</strong><strong>in</strong>g for example the style,<br />

the <strong>in</strong>tensity, the characteristics for each<br />

performer.<br />

ERGEBNIS VON CHATGPT 4:<br />

Section 1: Introduction<br />

(Duration: 1 m<strong>in</strong>ute)<br />

• Soroosh: Beg<strong>in</strong>s with a slow, melodic<br />

traditional Iranian setar piece, sett<strong>in</strong>g<br />

a reflective tone.<br />

• Mahdieh: Starts with broad, gentle<br />

strokes on the canvas, creat<strong>in</strong>g abstract<br />

shapes, captur<strong>in</strong>g the mood of<br />

Soroosh‘s music.<br />

• Johannes: Utilizes m<strong>in</strong>imal electronic<br />

effects, subtly amplify<strong>in</strong>g the setar‘s<br />

natural sound.<br />

Section 2: Transition<br />

(Duration: 1.5 m<strong>in</strong>utes)<br />

• Soroosh: Transitions to a rhythmic<br />

piece with elements of rock. Beg<strong>in</strong>s<br />

s<strong>in</strong>g<strong>in</strong>g with soft, lyrical voice:<br />

Verse 1: „In the echoes of ancient<br />

str<strong>in</strong>gs, / Through the halls of<br />

time it r<strong>in</strong>gs. / Melodies of ages past, /<br />

In mo<strong>der</strong>n chords, they‘re recast.“<br />

Chorus: „Bridges span from<br />

old to new, / In every note, a journey<br />

through. / Where tradition and tomorrow<br />

meet, / In harmony, they entw<strong>in</strong>e<br />

and greet.“<br />

• Mahdieh: Responds to the rhythm<br />

shift with more dynamic, expressive<br />

strokes, add<strong>in</strong>g texture.<br />

• Johannes: Starts captur<strong>in</strong>g Mahdieh‘s<br />

canvas sounds, blend<strong>in</strong>g them with<br />

Soroosh‘s music.<br />

Section 3: Exploration<br />

(Duration: 2 m<strong>in</strong>utes)<br />

• Soroosh: Switches to the electric setar,<br />

div<strong>in</strong>g <strong>in</strong>to an experimental avant-garde<br />

style, creat<strong>in</strong>g an <strong>in</strong>trigu<strong>in</strong>g<br />

soundscape.<br />

• Mahdieh: Intensifies her draw<strong>in</strong>g,<br />

us<strong>in</strong>g aggressive, rapid strokes to reflect<br />

the chaotic energy of the music.<br />

• Johannes: Processes the sounds from<br />

both performers, add<strong>in</strong>g electronic<br />

distortions and ambient sound files to<br />

enhance the avant-garde atmosphere.<br />

Section 4: Climax<br />

(Duration: 1.5 m<strong>in</strong>utes)<br />

• Soroosh: Comb<strong>in</strong>es elements of all<br />

previous styles <strong>in</strong>to a crescendo, blend<strong>in</strong>g<br />

traditional, rock, and experimental<br />

sounds.<br />

• Mahdieh: Reaches the peak of her visual<br />

performance, her movements becom<strong>in</strong>g<br />

almost performative, <strong>in</strong> sync<br />

with the music‘s <strong>in</strong>tensity.<br />

• Johannes: Fully <strong>in</strong>tegrates the sound<br />

collage, creat<strong>in</strong>g a powerful, immersive<br />

audio-visual experience.<br />

Section 5: Resolution<br />

(Duration: 2 m<strong>in</strong>utes)<br />

• Soroosh: Returns to the traditional setar,<br />

play<strong>in</strong>g a sooth<strong>in</strong>g, meditative melody,<br />

signal<strong>in</strong>g a return to the roots.<br />

• Mahdieh: Slows down her draw<strong>in</strong>g, add<strong>in</strong>g<br />

f<strong>in</strong>al touches, br<strong>in</strong>g<strong>in</strong>g a sense of<br />

closure to the visual narrative.<br />

• Johannes: Gradually fades out the<br />

electronic elements, leav<strong>in</strong>g the pure,<br />

unaltered sound of the setar to conclude<br />

the performance.<br />

Obiges wirkt auf den ersten Blick so, als<br />

ob ChatGPT durchaus wüsste, wovon<br />

28 <strong>OCG</strong> <strong>Journal</strong> | 04 • 20<strong>23</strong>

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!