KI benutzt ja mittlerweile fast jeder irgendwo und irgendwie, was die wenigsten aber tun, ist dass ganze lokal zu nutzen. Da ich mich in einer Apple Bubble befinde würde ich gerne mal wissen, wie sehr die Kollegen von AMD, Intel und Nvidia performen anhand eines Beispiel, was bei den meisten laufen sollte.
OpenAIs erstes local Free2Use Modell mit 20 Milliarden Parameter, welches ungefähr 12GB groß ist und in den RAM/VRAM passen muss.
Was müsst ihr tun?
1. LMStudio laden und starten: https://lmstudio.ai
2. Laden euch im discover Tab das 12.11GB große gpt-oss 20b MXFP4 Modell herunter
3. Startet das Modell und platziert es somit im Speicher
4. Öffnet einen Chat und gebt z.B "Fasse mir Harry Potter zusammen" ein
5. Notiert euch am unteren linken Rand die "tok/sec", welches die Token pro Sekunde sind, womit man die Ausführgeschwindigkeit messen kann.
Wenn ihr links auf "My Models" geht, könnt ihr u.a. auch über das Zahnrad neben dem Modell einstellen, ob die Last eher auf die CPU oder GPU gelegt werden soll, somit kann man unterschiedlich oder gemeinsam die Geschwindigkeit messen, je nach dem was man möchte.
Spoiler
Wenn alles geklappt hat, sollte das Chatfenster dann unten folgende Infos anzeigen. Somit lege ich mal vor mir meinem M3 Ultra und 60GPU Kernen, dabei hat die Kiste ca. 100w verbraucht.
Spoiler
Wenn ihr ein anderes Tool als LMStudio nutzt, auch kein Thema. Hauptsache ein paar Infos zum System und die Token/s kommen hier rein.
Happy Benching! Bin gespannt, was hier so bei rum kommt. :)
Obige Fehlermeldung bekomme ich hier am Desktop-PC inzwischen fast jeden Abend, aber nur, wenn ich für eine Stunde oder so hier im Forum unterwegs war!
Erst kann ich YT-Videos ganz normal anschauen (embedded und direkt auf youtube.com), irgendwann kommt diese Meldung und das war's für diesen Abend. Am nächsten Tag geht es dann wieder. :confused:
Ich habe zwar uBlock Origin laufen, aber kein VPN.
Auch JDownloader2 findet dann keine YT-Videos mehr, das Tool yt-dlp kann aber noch runterladen. Auch in Firefox kann ich weiter schauen, obwohl ich auch dort nicht angemeldet bin.
Kann es etwas mit dem Carrier-grade NAT von Deutsche Glasfaser zu tun haben? :uponder:
Kennt ihr das Problem? (Ich vermute hier gibt es noch ein paar Leute, die auch nicht ständig bei Google eingeloggt sind. X-D)
Und nein, "log dich halt ein" ist für mich keine Lösung. Am Android-Handy datenkrakt Google schon genug :upara:, am Desktop komme ich bisher gut so zurecht.
Ich habe mir kürzlich eine gebrauchte RTX 3080 Ti zugelegt. Läuft super, aber ein bisschen Pflege würde der GPU sicher guttun.
Ich möchte gerne die Thermal Pads austauschen. Nach etwas Recherche sollten es wohl 2 mm Pads sein.
Nun bin ich mir aber unsicher, welche Thermal Pads wirklich gut sind. Gelid gibts leider nicht in 2 mm, und über Thermal Grizzly habe ich nicht so viel Gutes gelesen
Ich erwarb dieses Gerät, neu mit Garantie für keine 400. Kann zwar nur DP 1.4, hat aber IPS und sieht nett aus ...
Ich nutze beim unteren Rechner einen PG35VQ - oben aber stehtein analoger Rechner mit 2 Dell U2412M - "etwas" älter also - der jedoch nicht wirklich zum Gamen genutzt wird, sondern zum Arbeiten.
Die Frage, die sich mir stellt - weitergeben oder behalten?
Kennt jemand das Teil? Weil wenn ich den auspacke wär er ja nimmer neu und schwieriger weiterzugeben.