Aarhus Universitets segl

Transcriber

Omdan lyd og video til tekst på få minutter. Ideel til interviews, undervisning, møder og forskningsdata.

Transskriberingen køres sikkert i SDU's datacenter under en databehandleraftale mellem AU og SDU.


Anbefalede ressourcer

Når du kører et Transcriber-job, anbefaler vi at bruge maskintypen gpu-nvidia-b200-1-mig.1g.

I vores benchmark behandlede 1 MIG et interview på 57 min. og 48 sek.7 min. og 20 sek., mens et 8-core CPU-job tog omkring 1 time og 40 min. for den samme fil. Da behandlingstiden kan variere afhængigt af filtype, lydkvalitet og indstillinger, bruger vi et konservativt estimat på 10 minutters behandlingstid pr. 1 times lyd på 1 MIG.

Som et groft planlægningsestimat kan du bruge:

MaskintypeEstimat
gpu-nvidia-b200-1-mig.1g0,03 GPU-timer pr. lydtime
cpu-amd-zen5-8-vcpu15–20 CPU compute-timer pr. lydtime

Da GPU-timer skal ansøges som hele tal, kan du bruge tabellen nedenfor, når du søger om ressourcer:

Samlede lyd-/interviewtimerGPU-timer at ansøge omAnbefalet maskintype
1–33 timer1 GPU-timegpu-nvidia-b200-1-mig.1g
34–66 timer2 GPU-timergpu-nvidia-b200-1-mig.1g
67–99 timer3 GPU-timergpu-nvidia-b200-1-mig.1g
100–132 timer4 GPU-timergpu-nvidia-b200-1-mig.1g

Vigtige bemærkninger

Til CPU-jobs skal du bruge mindst 8 cores og omkring 24 GB hukommelse, for eksempel cpu-amd-zen5-8-vcpu, for at mindske risikoen for, at Transcriber fryser eller løber tør for hukommelse under kørslen. I vores benchmark var RAM-forbruget omkring 8,5 GB gennem hele processen.

Til GPU-jobs anbefales 1 MIG. Det er normalt ikke nødvendigt at vælge 2 MIGs eller en fuld GPU til Transcriber-jobs, da gpu-nvidia-b200-1-mig.1g allerede giver hurtig transskriptionsydelse og har tilstrækkelig GPU-hukommelse.

Brug Batch-versionen, når det er muligt, for at undgå ressourcespild, da denne jobtype automatisk stopper, når transskriptionen er færdig. Hvis du bruger Default-versionen, skal du klikke på “Show settings” og aktivere “Transcribe and stop”, før du starter transskriptionen.

Når jobbet er færdigt, kan transskriptionsoutputtet hentes fra UCloud-job siden. Vælg det relevante projekt-workspace, derefter dit færdige job, og find outputsektionen nederst på siden under “Your job has completed”. Outputtet kan også findes i dine UCloud-filer.