Nyckelalternativ
- Använd Whisper för att transkribera röstanteckningar korrekt & snabbt gratis.
- Använd ChatGPT för att skapa kortfattade, strukturerade anteckningar från transkriptionerna utan ansträngning.
- Spara dina sammanfattade anteckningar i en anteckningsapp som Notion eller i ett allt-i-ett-verktyg som AudioPen.
Jag pratar snabbare än jag skriver. Det är också lättare för mig att vräka ut en tanke än att skriva ner den. Om du också föredrar att tänka högt som jag gör, stjäl mitt system för att transkribera röstanteckningar och hålla dem organiserade så att du aldrig förlorar koll på dina idéer igen.
Mitt kostnadsfria system för att transkribera, förfina och organisera mina röstanteckningar
< p>Jag har ett tredelat system där jag använder gratisappar och verktyg för att transkribera, förfina och organisera mina röstanteckningar. Här är en steg-för-steg-guide som visar hur jag använder den.
Steg 1: Använd Whisper för att transkribera din röst
Whisper är en gratis och öppen källkod tal-till-text AI-modell utvecklad av OpenAI. Den utmärker sig i att transkribera röst med enastående noggrannhet, även om källljudfilen har betydande bakgrundsljud.
För att använda Whisper kan du använda appar som drivs av AI-modellen. Däremot föredrar jag att använda Whisper Jax-implementationen som är tillgänglig gratis på Hugging Face-webbplatsen. Med det här verktyget kan du spela in ett röstklipp med din mikrofon, ladda upp en ljudfil eller skicka in en YouTube-video för att få den transkriberad.

Personligen spelar jag in min röst med min dators röstinspelare (eller min telefon) och laddar sedan upp den filen till webbplatsen. Jag gör detta för att jag gillar att lagra mina röstinspelningar tillsammans med de skrivna anteckningarna. Om du inte vill göra det kan du helt enkelt använda mikrofonfunktionen på webbplatsen för att transkribera din röst direkt.
Du kan också komma åt den här webbplatsen från din telefon och transkribera din röst när du är på språng.

Utvecklaren hävdar att du kan transkribera en 30-minuters ljudfil på 30 sekunder, och jag håller med om att det går snabbt. I exemplet ovan kan du se att min inspelning på 1 min och 22 sekunder transkriberas på 1,5 sekunder.
Det enda problemet är att det är en gratis demo, och användarförfrågningar hanteras enligt först till kvarn-principen. Så när webbplatsen får många användare kan du behöva vänta i en kö. Ibland kan belastningen vara så hög att den kanske inte registrerar din begäran, i så fall måste du fortsätta klicka på “Skicka” knappen tills du kommer i kön.
Stäng
Om du inte vill vänta så här länge kan du överväga att skapa din egen instans av Whisper Jax och köra den på din PC. Instruktionerna om hur man gör detta är tydligt skrivna på GitHub-sidan. Detta kan dock bli lite för tekniskt, speciellt om du aldrig har laddat ner och installerat filer från GitHub tidigare.
Alternativt kan du installera Whisper, som tillhandahålls av OpenAI, utan Jax-implementeringen. Som sagt, enligt min erfarenhet är det här tillvägagångssättet mycket långsammare, det tar 1 minut att transkribera 1 minuts ljud—men det är också mycket enklare att installera på din PC. Här är en YouTube-video om hur du installerar Whisper som du kan använda som referens:
Transkriptionshastigheten beror på din GPU och hur mycket VRAM du har. Om du inte har en dedikerad GPU kan du fortfarande köra Whisper med din CPU, men den är så långsam att du är bättre på att använda Whisper Jax gratisdemon på Hugging Face, även om du måste vänta i en kö.
Steg 2: Använd ChatGPT för att sammanfatta transkriptionen till kortfattade anteckningar
När du har transkriberat din ljudfil med Whisper får du en ostrukturerad textavbildning som utdata. Det kommer att vara rörigt, mångsidigt och se ut som en stor vägg av text. Vi måste rensa upp texten genom att eliminera allt ludd, strukturera det och presentera alla idéer med tydlig, lättförståelig formatering. För att göra detta kommer vi att använda ChatGPT—även den kostnadsfria versionen kommer att räcka.
Öppna helt enkelt AI-chattboten och ange följande prompt:
Jag har en lång transkriberad text från en röstinspelning, och jag behöver din hjälp för att skapa kortfattade anteckningar från den. Identifiera och sammanfatta nyckelpunkterna, besluten, åtgärderna och all annan relevant information från texten. Organisera anteckningarna i ett strukturerat format för enkel referens. Här är texten:
{Infoga transkriberad text här}
Och det är allt! ChatGPT kommer att bearbeta texten och ge dig en snyggt formaterad utdata som kommer att vara lätt att referera till i framtiden.
Enligt min personliga erfarenhet fungerar ChatGPT bäst när din inmatade text är 1500 ord eller färre. Som sådan, om transkriptionen är mer än 1500 ord lång, skulle jag råda dig att dela upp den i bitar och sedan mata den till ChatGPT. Du kommer då att få flera sammanfattade anteckningar. Du kan sedan instruera ChatGPT att kombinera alla anteckningar till en enda och använda det som slutresultat.
Steg 3: Spara anteckningarna i en anteckningsapp
När du har transkriptionen i sammanfattad anteckningsform är det sista steget att spara den i en valfri anteckningsapp. Du kan behålla den i Apple Notes eller Google Keep. Jag personligen föredrar att använda Notion för dess mer avancerade funktioner.
Och det är det! Du vet nu hur du förvandlar det du säger högt till kortfattade, lättlästa anteckningar och sparar dem för snabb hämtning och framtida referens.
Huvudproblemet med mitt system
Även om den kostnadsfria lösningen jag delade ovan är kraftfull, finns det några nackdelar. Den som stör mig mest är att jag behöver hoppa runt tre till fyra olika appar, som inkluderar min röstinspelare-app (din telefons standard bör göra det), Whisper-Jax webbapp, ChatGPT och slutligen, Idé, för att slutföra processen.
Ett annat problem är att hela systemet är beroende av att använda Whisper. Så om du använder Whisper Jax gratisdemon online, måste du ha det bra med att vänta under rusningstid. Om du bestämmer dig för att installera Whisper lokalt kan processen bli något tekniskt skrämmande, och du måste fortfarande ha ett kraftfullt system för att säkerställa anständiga transkriptionshastigheter.
Jag kan förstå att dessa nackdelar är ett problem för vissa användare, så här är ett superanvändarvänligt alternativ—AudioPen.
Jag utvecklade mitt kostnadsfria tredelade system för att omvända AudioPen eftersom jag gillade det så mycket!
strong>
AudioPen—En app för att transkribera, förfina och organisera dina röstanteckningar
AudioPen är ett allt-i-ett-verktyg som kan transkribera din röst, förfina den, ge den struktur och lagra den som anteckningar så att du kan komma åt dem när det behövs. Dessutom är det en webbapp som inte är beroende av dina systemspecifikationer för att fungera optimalt.

Den har en gratisversion, men den är lite barben. Det låter dig bara spela in (inte ladda upp) röstanteckningar, och varje inspelning är begränsad till 3 minuter.
För att använda den klickar du bara på mikrofonknappen och börjar prata. När du är klar trycker du på stoppknappen för att skicka din inspelning. AudioPen kommer att ta några sekunder till en minut att transkribera det du sa och presentera alla nyckelpunkter i en ren och strukturerad anteckning. Det kostnadsfria kontot har en gräns på 10 anteckningar, så du måste ta bort äldre anteckningar för att skapa nya om du når gränsen.
Stäng
Jag ser att gratiskontot fungerar för många människor, särskilt om du är okej med att fånga mindre röstinspelningar och kopiera och klistra in anteckningarna till en annan anteckningsapp för att frigöra utrymme på AudioPen.
Men om du vill ha mer utrymme för dina anteckningar och transkribera längre inspelningar kan du uppgradera till den betalda versionen—AudioPen Prime, som har en mängd fantastiska funktioner. För $99/år (eller $159 för 2 år), här’ är en titt på vad du får:
- Spela in upp till 15 minuters röstanteckningar eller ladda upp ljudfiler på upp till 25 MB.
- Spara obegränsat antal röstanteckningar.
- Skapa mappar och lägg till taggar för att organisera dina röstanteckningar.
- En kontextuell sökfunktion som låter dig enkelt söka igenom alla dina anteckningar.
- Alternativ för att ange en skrivstil och längd för de förfinade anteckningarna.
- Exportera dina anteckningar, publicera dem online som flashcards eller förvandla dem till märkesbilder och dela dem på sociala medier.
Att tala är snabbare och mer naturligt än att skriva, vilket låter dig fånga spontana idéer i realtid. Med verktyg som Whisper för korrekt transkription och ChatGPT för att förfina transkriberade texter kan du förvandla kaotiska tankar till tydliga, handlingsbara insikter. AudioPen förenklar detta ytterligare genom att kombinera transkription, förfining och organisation i en app. Denna superkraft säkerställer att du aldrig tappar koll på dina idéer, och håller din kreativitet och produktivitet på topp.
Leave a Reply
You must be logged in to post a comment.