Come utilizzo l'intelligenza artificiale per trascrivere e organizzare i miei appunti vocali

Concetti chiave

  • Usa Whisper per trascrivere accuratamente le note vocali e le informazioni vocali. veloce gratuitamente.
  • Utilizza ChatGPT per creare facilmente note concise e strutturate dalle trascrizioni.
  • Salva le tue note riepilogate in un'app per prendere appunti come Notion o in uno strumento all-in-one come AudioPen.

Parlo più velocemente di quanto scrivo. È anche più facile per me esprimere un pensiero piuttosto che scriverlo. Se anche tu preferisci pensare ad alta voce come me, ruba il mio sistema per trascrivere le note vocali e tenerle organizzate in modo da non perdere mai più traccia delle tue idee.

Il mio sistema gratuito per trascrivere, perfezionare e organizzare le mie note vocali

< p>Ho un sistema in tre parti in cui utilizzo app e strumenti gratuiti per trascrivere, perfezionare e organizzare le mie note vocali. Ecco una guida passo passo che mostra come lo utilizzo.

Passaggio 1: utilizza Whisper per trascrivere la tua voce

Whisper è un servizio gratuito e open source Modello AI di sintesi vocale sviluppato da OpenAI. Eccelle nella trascrizione della voce con notevole precisione, anche se il file audio sorgente presenta un rumore di fondo significativo.

Per utilizzare Whisper, puoi utilizzare app basate sul modello AI. Tuttavia, preferisco utilizzare l'implementazione Whisper Jax disponibile gratuitamente sul sito Web di Hugging Face. Questo strumento ti consente di registrare una clip vocale utilizzando il microfono, caricare un file audio o inviare un video YouTube per farlo trascrivere.

Personalmente, registro la mia voce utilizzando il registratore vocale del mio PC (o del mio telefono) e poi carico il file sul sito web. Lo faccio perché mi piace archiviare le mie registrazioni vocali insieme agli appunti scritti. Se non vuoi farlo, puoi semplicemente utilizzare la funzione microfono sul sito per trascrivere direttamente la tua voce.

Puoi anche accedere a questo sito Web dal tuo telefono e trascrivere la tua voce mentre sei in movimento.

Lo sviluppatore afferma che puoi trascrivere un file audio di 30 minuti in 30 secondi e sono d'accordo: è incredibilmente veloce. Nell'esempio sopra, puoi vedere la mia registrazione di 1 minuto e 22 secondi che viene trascritta in 1,5 secondi.

L'unico problema è che si tratta di una demo gratuita e le richieste degli utenti vengono gestite in base all'ordine di arrivo. Pertanto, quando il sito riceve molti utenti, potresti dover attendere in coda. A volte, il carico può essere così elevato da non registrare la tua richiesta, nel qual caso dovrai continuare a fare clic sul pulsante "Invia" pulsante finché non ti metti in coda.

Chiudi

Se non vuoi aspettare così a lungo, puoi prendere in considerazione la creazione della tua istanza di Whisper Jax ed eseguirla sul tuo PC. Le istruzioni su come eseguire questa operazione sono chiaramente scritte sulla sua pagina GitHub. Tuttavia, questo può diventare un po’ troppo tecnico, soprattutto se non hai mai scaricato e installato file da GitHub prima.

In alternativa, puoi installare Whisper, come fornito da OpenAI, senza l'implementazione Jax. Detto questo, secondo la mia esperienza, questo approccio è molto più lento, poiché richiede 1 minuto per trascrivere 1 minuto di audio, ma è anche molto più semplice da installare sul PC. Ecco un video di YouTube sull'installazione di Whisper che puoi utilizzare come riferimento:

La velocità di trascrizione dipenderà dalla tua GPU e dalla quantità di VRAM di cui disponi. Se non disponi di una GPU dedicata, puoi comunque eseguire Whisper utilizzando la CPU, ma è così lento che faresti meglio a utilizzare la demo gratuita di Whisper Jax su Hugging Face, anche se devi aspetta in coda.

Passaggio 2: utilizzare ChatGPT per riassumere la trascrizione in note concise

Dopo aver trascritto il tuo file audio utilizzando Whisper, otterrai un testo non strutturato come output. Sarà disordinato, prolisso e sembrerà un enorme muro di testo. Dobbiamo ripulire il testo eliminando tutta la lanugine, strutturandolo e presentando tutte le idee con una formattazione chiara e di facile comprensione. Per fare ciò utilizzeremo ChatGPT, anche la versione gratuita sarà sufficiente.

Apri semplicemente il chatbot AI e inserisci il seguente messaggio:

Ho un lungo testo trascritto da una registrazione vocale e ho bisogno del tuo aiuto per creare note concise da esso. Si prega di identificare e riassumere i punti chiave, le decisioni, le azioni e qualsiasi altra informazione rilevante dal testo. Organizzare le note in un formato strutturato per una facile consultazione. Ecco il testo:

{Inserisci qui il testo trascritto}

E questo è tutto! ChatGPT elaborerà il testo e ti fornirà un output ben formattato a cui sarà facile fare riferimento in futuro.

Nella mia esperienza personale, ChatGPT funziona meglio quando il testo di input è di 1500 parole o meno. Pertanto, se la trascrizione è lunga più di 1500 parole, ti consiglio di suddividerla in blocchi e poi di inviarla a ChatGPT. Otterrai quindi più note riassunte. Puoi quindi istruire ChatGPT a combinare tutte le note in una singola nota e usarla come output finale.

Passaggio 3: salva le note all'interno di un'app per prendere appunti

Una volta ottenuta la trascrizione sotto forma di nota riepilogativa, il passaggio finale è salvarla su un'app per prendere appunti di tua scelta. Puoi tenerlo all'interno di Apple Notes o Google Keep. Personalmente preferisco utilizzare Notion per le sue funzionalità più avanzate.

E questo è tutto! Ora sai come trasformare ciò che dici ad alta voce in note concise e facili da leggere e salvarle per un rapido recupero e riferimento futuro.

Il problema principale con il mio sistema

Sebbene la soluzione gratuita che ho condiviso sopra sia potente, ci sono alcuni inconvenienti. Quello che mi dà più fastidio è che devo passare da tre a quattro app diverse, tra cui l'app del registratore vocale (quella predefinita del tuo telefono dovrebbe andare bene), l'app web Whisper-Jax, ChatGPT e, infine, Nozione, per completare il processo.

Un altro problema è che l’intero sistema dipende dall’uso di Whisper. Quindi, se stai utilizzando la demo gratuita online di Whisper Jax, dovresti essere d'accordo con l'attesa durante le ore di punta. Se invece decidi di installare Whisper localmente, il processo può diventare un po’ tecnicamente scoraggiante ed è comunque necessario disporre di un sistema potente per garantire velocità di trascrizione decenti.

Posso capire che questi inconvenienti siano un problema per alcuni utenti, quindi ecco un'alternativa super user-friendly: AudioPen.

Ho sviluppato il mio sistema gratuito in tre parti per effettuare il reverse engineering di AudioPen perché mi è piaciuto così tanto!

AudioPen: un'app per trascrivere, perfezionare e organizzare le tue note vocali

AudioPen è uno strumento tutto in uno che può trascrivere la tua voce, perfezionarla, darle struttura e memorizzarla come note in modo da potervi accedere quando necessario. Inoltre, è un'app Web che non dipende dalle specifiche del sistema per funzionare in modo ottimale.

Ha una versione gratuita, ma è un po' scarna. Ti consente solo di registrare (non caricare) note vocali e ogni registrazione è limitata a 3 minuti.

Per usarlo, basta fare clic sul pulsante Microfono e iniziare a parlare. Una volta terminato, premi il pulsante Interrompi per inviare la registrazione. AudioPen impiegherà da pochi secondi a un minuto per trascrivere ciò che hai detto e presentare tutti i punti chiave in una nota pulita e strutturata. L'account gratuito ha un limite di 10 note, quindi dovrai eliminare le note più vecchie per crearne di nuove se raggiungi il limite.

Chiudi

Vedo che l'account gratuito funziona per molte persone, soprattutto se sei d'accordo con l'acquisizione di registrazioni vocali più piccole e il copia-incolla delle note su un'altra app per prendere appunti per liberare spazio su AudioPen.

Tuttavia, se desideri più spazio per i tuoi appunti e trascrivere registrazioni più lunghe, puoi passare alla versione a pagamento: AudioPen Prime, che racchiude una serie di straordinarie funzionalità. Per $ 99 all'anno (o $ 159 per 2 anni), ecco cosa ottieni:

  • Registra fino a 15 minuti di note vocali o carica file audio fino a 25 MB.
  • Salva note vocali illimitate.
  • Crea cartelle e aggiungi tag per organizzare le tue note vocali.
  • Una funzione di ricerca contestuale che ti consente di cercare facilmente tra tutte le tue note.
  • Opzione per specificare uno stile di scrittura e una lunghezza per le note raffinate.
  • Esporta i tuoi appunti, pubblicali online come flashcard o trasformali in immagini con marchio e condividili sui social media.

Parlare è più veloce e più naturale che scrivere e ti consente di catturare idee spontanee in tempo reale. Con strumenti come Whisper per una trascrizione accurata e ChatGPT per perfezionare i testi trascritti, puoi trasformare i pensieri caotici in informazioni chiare e fruibili. AudioPen semplifica ulteriormente tutto ciò combinando trascrizione, perfezionamento e organizzazione in un'unica app. Questo superpotere ti assicura di non perdere mai traccia delle tue idee, mantenendo la tua creatività e produttività al massimo.


Posted

in

by

Tags:

Comments

Leave a Reply