Szoftver és MI: A kreatív logika szabadsága
A kezdetek: Amikor a szintaxis még gátat szabott
Kevesen tudják rólam, de a középiskolát matematika–informatika
szakon végeztem, 9. és 12. osztály között ugyanis már élénken érdekelt a technológia világa. Akkoriban a Pascal nyelv volt a tananyag, és őszintén bevallom, a pszeudokódokban való gondolkodás és a merev szintaktikai szabályok követése távol állt tőlem. Ami viszont már akkor is magával ragadott, az a szoftverek belső logikája, a működési elvek megalkotása és a rendszerszintű tervezés volt.
A felhasználói élmény kritikusa
Az évek során számtalan programmal dolgoztam,
és gyakran értetlenül álltam a logikátlan megoldások vagy a váratlan összeomlások előtt. Sokszor éreztem úgy, mintha a szoftverek alapvető működési elveit nem a hatékonyság, hanem véletlenszerű ötletek vezérelnék.
Mindig is volt egyfajta „beépített érzékem” a hibák és anomáliák felismeréséhez. Amikor egy új programot kezdek használni, szinte azonnal megtalálom a gyenge pontjait, és megszületik a fejemben egy optimálisabb, logikusabb megoldás. Volt olyan videóvágó szoftver, amellyel annyi technikai hibát azonosítottam, hogy ha a fejlesztők minden bug után jelképes összeget fizettek volna, ma már márványpalotában laknék. Bár a szoftverek minősége sokat javult az elmúlt 15 évben, még ma is találkozni olyan évtizedes anomáliákkal, amelyeket a fejlesztők valamiért figyelmen kívül hagynak.
Az áttörés: Programozás természetes nyelven
A fordulópont 2024-ben érkezett el, amikor felfedeztem a
mesterséges intelligenciával támogatott fejlesztést. Megkönnyebbülést jelentett, hogy a szintaktikai nehézségek többé nem jelentenek akadályt. Végre arra koncentrálhatok, ami igazán érdekel: a funkciókra, a logikai felépítésre és a felhasználói útvonalakra.
Ahogy Jensen Huang, az NVIDIA vezetője is vallja:
a legfontosabb programozási nyelv ma már a természetes emberi beszéd. Én magyarul vagy angolul fogalmazom meg a koncepciót, az LLM (Large Language Model) pedig „lefordítja” azt Python nyelvre. Az OpenAI o1 modellje, majd a Gemini 3.1 megjelenése hozta el azt a szintet, ahol a mérnöki pontossággal megfogalmazott utasításaim (promptjaim) 99%-ban azonnal működő kódot eredményeznek.
A „Senior Vibe Coder” korszaka
2024 óta a szoftverfejlesztés a szenvedélyemmé vált.
Ma már több modellel, többek között a Google Antigravity segítségével dolgozom. Kicsit viccesen „senior vibe codernek” nevezem magam, hiszen bár a manuális szintaxisírás nem az erősségem, a komplex rendszerek átlátása és a kreatív dizájn annál inkább. A mesterséges intelligencia segítségével ma egy hónap alatt annyit haladok a hobbi projektjeimmel, amennyihez 2015-ben egy profi fejlesztőcsapatnak egy egész évre lett volna szüksége.
FONTOS MEGJEGYZÉS A TELEPÍTÉSEKHEZ:
Mivel az általam készített szoftverek a feltörekvő Wraith Dreams márkanév alatt jelennek meg, letöltéskor vagy indításkor a Windows SmartScreen biztonsági funkciója esetenként figyelmeztetést jeleníthet meg. Biztosíthatom, hogy a programok teljesen kártevőmentesek és biztonságosak.
A telepítés folytatásához Windows 10 és 11 rendszereken egyszerűen kattintson a „More info…” (További információ) feliratra, majd válassza a „Run Anyway” (Futtatás mindenképp) gombot. Ezt követően a telepítés problémamentesen lezajlik.
Elérhető szoftverek
Hamarosan több kereskedelmi forgalomba kerülő szoftvert is publikálok,
de addig is szeretnék megosztani veletek néhány ingyenes más programot, ezek béta verziók, amelyeket Windows 10/11 vagy Linux operációs rendszeren már most kipróbálhattok. Ezek a programok ingyenesek és azok is maradnak. A jövőben érkeznek majd komplexebb, AI-integrált megoldások is, amelyek iOS és Linux platformokon is elérhetőek lesznek.
WR Media Extractor by Wraith Dreams V1.1
Ez a célszoftver arra szolgál, hogy meglévő .mkv konténerekből gyorsan
és egyszerűen kinyerje a hangsávokat (.wav) és a feliratokat (.srt).
• Platform: Windows 10/11
• Licensz: Ingyenesen használható és
terjeszthető (kereskedelmi forgalomba nem hozható).
A Whisper Transcriber Pro egy professzionális asztali alkalmazás, amely mesterséges intelligencia segítségével képes hanganyagokat és videókat pontosan szöveggé vagy felirattá alakítani. A szoftver az OpenAI Whisper modelljének legerősebb, „large” változatát használja a fő feladatokra, miközben egy kisebb modellel intelligensen darabolja fel a mondatokat a tökéletes időzítés érdekében.
A szoftver a háttérben komoly számításokat végez, ezért érdemes tisztában lenni a gépigénnyel:
• Operációs rendszer: Windows 10/11 | Linux (auto installs GPU driver on nVidia)
• Videókártya (GPU): Erősen ajánlott egy
minimum NVIDIA RTX 4060 kártya használata a gyors feldolgozáshoz.
• Minimum 8 GB VRAM, ajánlott: 16 GB VRAM.
• Memória (RAM): Minimum javasolt 16 GB.
• Telepítés: .exe telepítő
Az összes felhasználói felület nyelv, amit támogat: angol, magyar, román, spanyol, francia, görög, urdu, indonéz, cseh, szlovák, finn, holland, svéd, török, lengyel, hindi, kínai, japán, koreai, arab, német, olasz, portugál, orosz.
A Whisper modell által natívan támogatott nyelvek a programban: [automatikus], afrikaans, albán, amhara, arab, örmény, asszámi, azeri, baskír, baszk, belarusz, bengáli, bosnyák, bolgár, burmai, katalán, kínai, horvát, cseh, dán, holland, angol, észt, finn, francia, galíciai, grúz, német, görög, gudzsaráti, haiti kreol, héber, hindi, magyar, izlandi, indonéz, olasz, japán, jávai, kannada, kazah, khmer, koreai, lao, latin, lett, litván, luxemburgi, macedón, maláj, malajálam, máltai, maráthi, mongol, nepáli, norvég, pastu, perzsa, lengyel, portugál, pandzsábi, román, orosz, szerb, szingaléz, szlovák, szlovén, spanyol, szundanéz, szuahéli, svéd, tagalog, tádzsik, tamil, tatár, telugu, thai, tibeti, török, türkmen, ukrán, urdu, üzbég, vietnámi, walesi, joruba.
A program ingyenesen letölthető és használható: