๐๐ฎ๐ฑ๐ฎ๐ฎ ๐ฟ๐ฎ๐ฏ๐๐ถ๐ฑ ๐ถ๐ป๐ฎ๐ฎ ๐ธ๐ฎ ๐ณ๐ถ๐ถ๐ฐ๐ป๐ฎ๐ฎ๐๐ถ๐ฑ ๐ฎ๐๐ฒ๐ฟ๐ฎ๐ด๐ฒ ๐๐ ๐๐๐ฒ๐ฟ ๐ฎ๐บ๐ฎ ๐พ๐ผ๐ณ ๐ฐ๐ฎ๐ฎ๐ฑ๐ถ ๐ฒ๐ต ๐ผ๐ผ ๐๐ต๐ฎ๐๐๐ฃ๐ง ๐ฐ๐ฎ๐ฎ๐ฑ๐ถ ๐๐ฎ๐ ๐๐ฒ๐ฒ๐๐ฑ๐ถ๐ถ๐๐ผ, ๐พ๐ผ๐ฟ๐ฎ๐ฎ๐น๐ธ๐ฎ๐ฎ๐ป ๐ฎ๐พ๐ฟ๐ถ๐๐ผ.

@abdinajibmohamed12
ChatGPT iyo AI-yada lamidka eh waxaa la dhahaa Large Language Models (LLMs).
๐ฆ๐ถ ๐ณ๐๐ฑ๐๐ฑ ๐๐ถ๐ฑ๐ฒ๐ฒ ๐๐๐ต๐ฎ๐พ๐ฒ๐ฒ๐๐ฎ๐ฎ๐ป?
LLMs-ka waxa lee sameeyaan, markaa qoraal uqortid, waxee qiyasayaan ereyadaan laguu sooqoray maxaa ku xigi jiray caadiyaan.
Tusaale: Hadaa AI uqortid:
โ๐ฐ๐ฎ๐ฎ๐๐ถ๐บ๐ฎ๐ฑ๐ฎ ๐๐ผ๐บ๐ฎ๐น๐ถ๐ฎ ๐บ๐ฎ๐ด๐ฎ๐ฐ๐ฒ๐ฒ๐ฑ โ
AI-ga waxuu heestaa data badan oo lagu tababaray, badana waxaa kala dageen internetka. Waxuu sameenaa list oo ereyo eh uu ka soo dhex helay datadii lagu traingareeyay.
Tusaale ahaan, gudaha modelka waxuu ka fiirinaa sidaan oo kale (tani waa inuu isagaa ku jirto maskaxdiisa, adiga ma arkeysid):
- Caasimada somaliya ___
- waa [80%]
- Mogadishu [75%]
- xamar [65%]
- kismaayo [50%]
Ereyadaan probability bay wataan, oo ah fursad ay sax ku noqon karaan. Tusaalaha kore, datada modelka lagu tababaray waxaa badanaa ku xigeysay โcaasimada somaliaโ ereyga โwaaโ. Sababtoo ah dadka badanaa โcaasimada Somalia Mogadishuโ maqoraan; af-Soomaali natural ah maโahan. Statistically midka udhow aa qiyaasoonaa, so โwaaโ buu qaataa:
Caasimada somaliya waa ___
Markaas waxaa markale loo gelinaa AI-ga, hadane wuu qiyaasaa ereyga ku xiga:
- Caasimada somaliya waa ___
- Mogadishu [90%]
- xamar [60%]
- kismaayo [50%]
Markaas ayuu dhahaa:
Caasimada somaliya waa Mogadishu.
Uma baahnid inaa ML engineer noqotid si aad u fahamtid. Marka LLM maqashid, maskaxda ha kaaga soo dhacdo: waxaa lee qiyaasaa ereygaan ereyga ku xigo, maaha iney sida bani-aadamka jumlad dhameestiran u akhrinayaan oo fahmayaan.
๐ง๐ผ๐ธ๐ฒ๐ป๐
Kor waxaan aad u isticmaalayay ereyga โereyโ, markaan sharxaayey LLMs; lkn sida saxda ah waxaa la dhahaa token.
Token waxaa waaye: markee LLM-yadu qiyaasta sameynayaan, qoraalka waxee u jajibiyaan qaybo yaryar oo la dhaho tokens. Token mararka qaarkood waa ka weynaan karaa erey, mararka qaar ka yaraan karaa.
Hadaa rabtid inaad aragtid ChatGPT tokenization suu u sameeyo, ka fiiri:
Halkaas waxaad ku arkeysaa qoraal kasta in tokens loo kala jabinayo.