AI · On-device

Samfuran Na'urar Suna Zama Isassun Nagarta Don Barin Gajimare

Sabon guguwar samfura ƙanana suna gudana gaba ɗaya a kan laptop ko wayarka — sauri, na sirri, kuma ba tare da ma'aunin API ba.

Samfuran Na'urar Suna Zama Isassun Nagarta Don Barin Gajimare

Shekaru da yawa zato ya kasance cewa AI mai amfani dole ne ta zauna a cibiyar bayanan wani. Wannan zato yana rushewa a hankali.

Sabon tsarar samfura ƙanana — ‘yan biliyoyin sigogi, waɗanda aka ƙididdige su don gudana akan kayan masarufi — yanzu sun isa ga taƙaitawa, rubutawa, rarrabawa, da kammala lamba ba tare da taɓa hanyar sadarwa ba.

Na sirri ta tsohuwa. Gudanar da gida yana juya labarin sirri. Babu wani abu da ke barin na’urar, babu farashi kowane buƙatu, kuma samfurin yana ci gaba da aiki a cikin jirgin sama ko gidan ƙasa.

Cinikin shine iyawa: manyan samfuran iyaka har yanzu suna cin nasara akan mafi wuyar ayyukan tunani. Amma ga doguwar wutsiya na ayyukan yau da kullun, “isasshe nagarta kuma a kan injina” yana fara doke “mafi kyau kuma an auna shi.”

Yayin da muke zurfafa cikin 2026, sauyawa daga dogaro mai nauyi na gajimare zuwa ƙaƙƙarfan hukunci na cikin na’ura yana sake fasalin yadda masu haɓakawa da masu amfani na yau da kullun ke hulɗa da AI. Ga dalilin da yasa juyin AI na gida ya zo a ƙarshe, da yadda zaku iya amfani da shi a yau.


“Ƙananan Kattai” Masu Tafiyar da Canji

Dalilin da yasa ba ku buƙatar babbar cibiyar bayanai don taƙaita PDF ko rubuta rubutun Python ya zo ne ga dabarar inganta lissafi da ake kira ƙididdigewa. Ta hanyar damƙa daidaiton nauyin samfurin (alale, sauke daga 16-bit zuwa 8-bit ko ma 4-bit cikakkun lambobi), masu haɓakawa sun rage ƙwaƙwalwar ajiyar waɗannan samfuran sosai. Wannan yana ba da damar AI mai ban mamaki ta dace gaba ɗaya a cikin RAM na daidaitaccen laptop ɗin mabukaci.

Fitattun iyalai na Ƙananan Samfuran Harshe (Small Language Models — SLMs) suna mamaye wannan filin yanzu:

  • Google Gemma 4: Iyalin samfurin budewa na Google an gina shi ne musamman don shigar da na’urar. Bambance-bambancen Gemma 4 (4.5B da 12B) suna kawo tsari ɗaya a cikin rubutu, hoto, da sauti. Bambancin 12B yana iya gudana cikin kwanciyar hankali akan 16GB VRAM kuma yana aiwatar da ayyukan tunani waɗanda shekaru biyu kacal da suka gabata zasu buƙaci samfurin sigogi biliyan 70.
  • Meta Llama 3.1 (8B): Tare da babbar taga mahallin 128K, samfurin sigogi biliyan 8 na Meta mai inganci yana ba da daidaito mai kyau tsakanin ƙarfi da ingancin kayan aiki. Ya kasance ma’aunin zinare don gudanar da rubutun budewa, coding, da ayyukan tunani na asali a cikin gida.
  • Qwen 3 & Mistral Nemo: Qwen 3 (8B) na Alibaba da Nemo (12B) na Mistral sun ƙware a ayyuka da yawa da hadaddun bututun sarrafa harshe na halitta. Suna tabbatar da cewa ba ku buƙatar babban ababen more rayuwa don gina ingantaccen fassarar lokaci-lokaci ko kwararar aikin wakilin gida.

Gajimare vs. AI na Gida: Me Kuke Bukata?

Idan kai mai haɓakawa ne ko kasuwanci da ke ƙoƙarin yanke shawarar ko biyan kuɗi don maɓallin API ko tura samfurin gida, yanke shawara yawanci ya dogara da rikitarwar aikin ku da buƙatun sirri na ƙungiyar ku.

FasaliAI na Gida (Na’urar)AI na Gajimare (API / Chatbot)
Sirrin Bayanai100% na sirri; bayanai ba sa barin na’urar.Ana aika bayanai zuwa sabar waje don sarrafawa.
Tsarin FarashiKyauta bayan siyan kayan aiki na farko.Biya kowane token ko rajistan wata.
Bukatar IntanetCikakken iya aiki ba tare da layi ba (yana aiki a ko’ina).Yana buƙatar ci gaba, haɗin yanar gizo mai karko.
Ƙarfin ƘarsheAn inganta don ayyukan yau da kullun (3B–12B sigogi).Tunani na iyaka da bincike mai zurfi (Triliyoyin+ sigogi).
LatencySamuwar token nan take (babu latency na cibiyar sadarwa).Dogara akan latency na cibiyar sadarwa da cunkoson uwar garken.

Maganar Ƙarshe: Dogara ga AI na gajimare lokacin da kuke buƙatar samfurin don tsara hadadden gine-ginen software daga tushe. Yi amfani da AI na gida don gyara imel, taƙaita bayanan taro, bincika takaddun kuɗi na sirri, da taimakon coding na yau da kullun.


Kayan Aikin Da Ke Sa Hakan Muyi

Ingantaccen software rabin labarin ne kawai. Babban abin da ke haifar da bunƙasar AI na gida shine saurin karɓar NPU (Na’urar Sarrafa Jijiya) na yau da kullun.

Ba kamar CPU na manufa ɗaya ba, NPU siliki ne na musamman da aka gina don aiwatar da matsananciyar lissafin matrix daɗaɗɗen da hanyoyin sadarwar jijiya ke buƙata. Gudanar da samfurin AI gaba ɗaya akan CPU yana da rashin inganci sosai — yana ƙara ƙarar baturi da sauri kuma yana haifar da zafi mai yawa. NPU tana aiwatar da lissafi daidai da ƙaramin ƙarfin wuta.

  • Copilot+ PC & Snapdragon: Sabon tsarar kwamfutocin Windows da ke aiki da dandamalin Snapdragon na Qualcomm (tare da guntu masu fafatawa daga AMD da Intel) yanzu suna da NPU masu iya fiye da 40 zuwa 50 TOPS (Triliyoyin Ayyuka a Sakan). Wannan shine matakin tushe da ake buƙata don gudanar da ayyukan AI na “koyaushe” cikin sauƙi ba tare da sadaukar da rayuwar baturi ba.
  • M4 Silicon na Apple: Apple ya ɗauki hanya dan kadan daban ta hanyar dogaro sosai ga babban bandwidth na ƙwaƙwalwar haɗin gwiwa. Tare da bandwidth na ƙwaƙwalwar ajiya har zuwa 546 GB/s akan guntu M4 masu girma, MacBooks na zamani na iya loda manyan hanyoyin sadarwa na jijiya nan take, suna barin GPU da Injin Jijiya su sami damar duk tsarin RAM lokaci guda.

Godiya ga waɗannan ci gaban kayan aiki, laptop ɗin ku yanzu yana iya gudanar da babban samfurin harshe ba tare da masu sanyaya suna yin sauti kamar injin jet ba.


Gudanar da Samfurin AI a Kan Laptop ɗin Ku Yau

Fara AI na gida baya buƙatar kewaya layin umarni ko digiri na kimiyyar kwamfuta. Kuna iya mayar da na’urar ku ta yanzu zuwa tashar aikin AI keɓe a cikin ƙasa da mintuna biyar.

  1. Sauke Kunshin AI na Gida (Minti 2) Sauke aikace-aikacen tebur mai amfani kamar LM Studio ko Ollama. Waɗannan kayan aikin suna ba da tsabta, mai kama da ChatGPT kuma suna sarrafa ta atomatik duk hadadden ababen more rayuwa na baya (kamar mahalli na Python da loda samfurin).

  2. Zaɓi kuma Sauke Samfurin (4GB–8GB Da Ake Bukata) A cikin kundin abubuwan da aka gina na aikace-aikacen, bincika samfurin nauyi mai sauƙi, wanda aka ƙididdige shi kamar Llama 3.1 8B ko Gemma 4. Danna saukewa kai tsaye a cikin mahaɗin.

  3. Fara Hira Ba tare da Layi ba Buɗe sabon zaman hira a cikin app ɗin, zaɓi samfurin ku da kuka sauke kwanan nan daga menu na saukarwa, kuma aika tsokaci. Kuna iya ma cire haɗin Wi-Fi ɗin ku don tabbatar da cewa yana gudana gaba ɗaya a cikin gida.


Tambayoyin Da Aka Yi Yawaita

Zan iya gudanar da samfurin AI na gida mai ƙarfi akan Mac?

Eh. Injinan Apple Silicon (daga M1 zuwa M4) ana ɗaukarsu a matsayin mafi kyawun na’urorin mabukaci don AI na gida. Tsarin ƙwaƙwalwar ajiyar su na haɗin gwiwa yana ba da damar GPU ya sami damar duk RAM ɗin tsarin, yana ba ku ƙarin ƙwaƙwalwar ajiya don ayyukan AI fiye da saitunan Windows na yau da kullun tare da ƙananan GPU na musamman.

Shin AI na gida kyauta ne gaba ɗaya?

Eh. Samfuran budewa (kamar waɗanda Meta, Google da Mistral suka fitar) da kayan aikin hoto da ake amfani da su don gudanar da su (kamar Ollama da LM Studio) kyauta ne don saukewa da amfani. Babu kuɗin biyan kuɗi na gaba ko farashin API kowane token.

Nawa RAM laptop ɗina yake buƙata don gudanar da AI?

Don ƙananan samfura (har zuwa sigogi biliyan 8), 8GB zuwa 16GB na RAM tsarin ya isa don samar da rubutu na yau da kullun. Don samfura na tsakiya (kamar 12B ko 14B), 16GB shine mafi kyau. Idan kuna shirin gudanar da kwararar aikin wakili, samar da hoto mai multimodal, ko ayyukan coding masu zurfi, 32GB ko fiye ana ba da shawarar sosai.