#کامپیوتر — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #کامپیوتر, aggregated by home.social.
-
وقتی میریم ارزونترین دانگل بلوتوثی بازار رو میخرید نتیجهاش این میشه که از هر چند باری که به هندزفری بلوتوثی میخوای وصل بشی، اکثرا وصل نمیشه.
جنس دیجیتال میخواید بخرید یا خوب بخرید یا کلا نخرید. در ضمن خواستید دانگل بلوتوثی بخرید، بلوتوث ۵.۰ یا بالاتر بخرید.
-
اگر شما هم از «قدیمی»های جامعه نرمافزار آزاد و متنباز ایران باشید، احتمالا با خیلی از پروژههایی که هدفشان ساخت یک توزیع گنو/لینوکس متناسب با نیاز روز کاربر بوده، آشنایید. چرا که به درازای تاریخ ورود گنو/لینوکس به ایران، تلاش برای ساخت توزیع ایرانیزهشده هم بوده.
اما متاسفانه، یک نگاه اجمالی به دیستروواچ (لینک) میتونه به ما نشون بده که تمامی این پروژهها در نقطهای متوقف شدند. البته لازم به ذکره که پروژههایی مانند زمین، کاپریس و جبیر هم بودند که متاسفانه در دیستروواچ مدخل مرتبط با خودشان را نتونستن داشته باشن.
اما چند وقت پیش، توجهم به پروژهای جلب شد که اتفاقا کاملا زندهست و خیلی هم خوب داره پیش میره. پروژهای با نام «پارچلینوکس» که در واقع ترکیبی از واژههای Persian و Arch Linux میتونیم در نظر بگیریم. این ترکیب، موجب ساخت یک اسم بامزه هم شده که به نظرم این خودش میتونه تا حد خوبی، ارزش برندینگ خلق کنه برای این محصول. برای دریافت این توزیع و اطلاعات بیشتر میتونید به وبسایتش (لینک) مراجعه کنید.
آشنایی اجمالی با آرچ
احتمالا اگر کاربر گنو/لینوکس باشید، اسم آرچ رو به وفور شنیدید. یک توزیع نهچندان دوستداشتنی که بخاطر مدل عرضه «غلتان» معروفه. البته گذشته از اون، بخاطر این معروفه که همه چی رو «ساده» نگه داشته و از قاعده KISS پیروی میکنه.
در واقع، اگر شما در این زمینه تازهکار باشید، آرچ رو اصلا و ابدا نمیتونید بدون کمک یک حرفهایتر، ویدئو یا مستند خاصی نصب کنید. اما خب از طرفی هم آرچ امکانات جالبی داره (مثل AUR) و به نسبت توزیعهای سنتیتر (دبیان مثلا) در بعضی سختافزارها میتونه کارکرد بهتری از خودش نشون بده.
یکی از دلایلی که تعداد نسبتا خوبی توزیع مبتنی بر آرچلینوکس داریم، دقیقا همینه. توزیعیه که چیزهای خوبی برای عرضه داره ولی خب در دسترس همه نیست. به همین خاطر هم خیلی از افرادی که بیشتر من و شما با آرچ آشنان، اومدند و توزیعهایی ساختند که به ما هم کمک کنه ازش لذت ببریم.
بریم سراغ پارچ!
من به سهراب (سازنده پارچ) قول یک «نقد منصفانه» دادم و خب، اینجا هم میریم که به صورت منصفانه نقدشون کنیم.
اول بگم که با شناختی که از پروژه پیدا کردم، سازندگان توزیع، روی KDE بیشتر مانور دادند و وقت گذاشتن (و البته این به معنای بد بودن سایر نسخهها نیست) و اگر سیستم خوبی دارید، به نظر من بهتره مستقیم برید سراغ این نسخه.
من از اونجایی که میخواستم روی ماشین مجازی تست کنم و بعد به یک لپتاپ قدیمی ببرمش، نسخه XFCE رو دانلود و نصب کردم.
برخوردهای اولیه
پس از این که تصویر ISO پارچ رو بوت کردید، این صفحه به شما نمایش داده میشه:
طرح پسزمینه، جذاب و ایرانیه. معمولا خیلی از توزیعهای مشابه روی این صفحه پسزمینه خاصی نمیذارند. پس این هویت بصری، به نظرم تا اینجا یک نقطه قوت برای این توزیع بوده.
پس از این که گزینه اول رو انتخاب کنیم، به این صفحه میرسیم:
اینجا برام جالب بود. عموما XFCE در چنین توزیعهایی، پنلی به تقلید از ویندوز در پایین صفحه دارند، یا این که نرمافزارهایی مثل cairo-dock یا Plank رو پایین صفحه قرار میدند و پنل رو به بالا منتقل میکنند (به تقلید از macOS) که خب در اینجا کلا شکل متفاوتی از پنل xfce رو شاهدیم. پنل که گوشه سمت چپ صفحه نمایش قرار گرفته و امکان خوبی برای استفاده از فضای افقی مانیتور فراهم میکنه.
مورد بعدی، Welcome Screen جذاب این توزیعه. این هم از مواردیه که در توزیعهایی مثل پارچ، خیلی کمتر به چشم میخوره. ولی خب تا اینجا پارچ بسیار فراتر از یه ریمستر ساده از آرچ خودش رو نشون داده.
نصاب
مثل خیلی از توزیعهای این روزها، پارچ هم از کالامارس برای نصب خودش روی دیسک شما استفاده میکنه و خب وقتی لوکیشن شما رو بر اساس IP ایران تشخیص بده، فارسی میشه و سیستمعامل هم فارسی نصب میکنه.
در نصاب تفاوت خیلی زیادی با سایر توزیعها مشاهده نمیکنیم که این هم میتونه یک نقطه قوت محسوب بشه. چرا که حس آشنایی برای کاربرانی که از سایر توزیعها میان داره.
به همین خاطر، نماگرفتهای بیشتری از نصاب اینجا قرار نمیدم.
پروسه نصب، حدود ۳-۴ دقیقه طول میکشه و بعد از اون به این صفحه میرسیم:
و اینجاست که با یک ریبوت، به دنیای پارچ میریم 🙂
تست پارچ پس از نصب
راستش یکم نقدم اینجا قراره تند بشه به چندین دلیل. نخستین دلیل اینه:
وقتی در syslinux که موقع بوت شدن ISO دیدیم اون پسزمینه زیبا به چشم میخوره، انتظار داشتم در گراب هم همون شمایل رو ببینم. با توجه به این که VirtualBox دارم انتظار لود شدن کامل plymouth نداشتم (اگر توزیع داشته باشه) ولی انتظار گراب زیباتری رو داشتم. گرچه پسزمینه گراب فقط یه عکسه و تغییری در کارکرد سیستم نداره.
اما مشکل اصلی من، بعد از بوت شدن شروع شد. پروسه بوت، کاملا درست طی شد ولی SDDM (مدیر نمایشگر) درست کار نکرد و مجبور شدم با یکم دانش لینوکسیای که داشتم، وارد محیط گرافیکی بشم.
البته نکته خوب اینجاست که این مورد رو سریعا به سازندگان توزیع اطلاع دادم و راهحل سریعی براش ارائه دادند و از اون گذشته، در برنامه قرار دادند که در ریلیزهای بعدی این مشکل پیش نیاد. این پشتیبانی جامعهمحور، برای من جالب و تحسینبرانگیز بود.
محیط گرافیکی و عملکرد آن
خب، پس از فیکس کردن SDDM چنین صفحهای رو میبینیم:
و پس از ورود پسورد، به محیط زیبای XFCE وارد میشیم:
برای تست یه سری موارد هم، ترمینال رو باز کردم و GIMP رو روی پارچ نصب کردم و همهچی خیلی خوب و روان پیش میرفت.
جمعبندی
برخلاف خیلی از توزیعهای جدیدی که هرروز ایجاد میشن، پارچ تا حد خیلی خوبی حرف برای گفتن داره. یکی از دلایلش هم اینه که سیستم پایداری خوبی داره و تا الان، خبری از این که سیستم کلا از کار بیفته یا سر نصب بستهها کرش کنه؛ نبوده.
در کل تجربه بسیار خوبی برای من رقم زد، آن هم در ویرچوال باکس مک (که احتمالا میدونید بلای عالمه) اما خب من رو داره قلقلک میده که بعنوان سیستمعامل اصلی کامپیوتر قدیمی، ازش استفاده کنم.
حتی با توجه به سختافزار لپتاپ قدیمی (پردازشگر i5 نسل چهارم و ۱۶ گیگابایت حافظه) عجیب نیست که نسخههای KDE یا GNOME هم بتونم بدون مشکل اجرا کنم. قطعا پس از نصب روی ماشین واقعی هم نقد مجددی بر این توزیع، خواهم نوشت.
در پایان و بعنوان حسن ختام هم باید بگم که مایه خوشحالیه که در شرایطی که هیچکس به فکر جامعه نرمافزار آزاد نیست، چنین پروژههایی زنده هستند و به باقی دوستان، امید میدن.
موفق و موید باشید.
#اوبونتو #سیستمعامل #کامپیوتر #گنو #گنولینوکس #لینوکس #متنباز #نرمافزارآزاد #نرمافزارمتنباز
-
در دنیایی که AI و بخصوص از نوع Generative به شدت در اون مهم شده، یکی از مسائل بزرگی که باهاش روبرو هستیم، چیرگی زبان انگلیسی بر جویه که ساخته شده.
من در مطلب پیشینم، در مورد چیرگی زبان انگلیسی بر دنیای هوش مصنوعی نوشته بودم که میتونید بخونید و ببینید که چه مشکلاتی وجود دارند که داریم باهاشون دست و پنجه نرم میکنیم.
اما خب، الان قضیه کمی متفاوت شده و ما در این مطلب قراره «مارال» رو بررسی کنیم، هم این که ایدهش از کجا آمد و هم این که چیه و چه فرقهایی با تلاشهای پیشین داره و هم این که در کل مزیتش چیه.
مارال هفت میلیارد پارامتری و مزایای آن
در تابستان امسال یا دقیقتر بگم روز ۱۵ تیر ۱۴۰۲، من رویدادی با نام Summertime AI برگزار کردم. رویداد برای معرفی چندین ابزار هوش مصنوعی بود و من اشارهای به ابزاری به اسم «مارال» کردم.
مارال در اون زمان، قرار بود یک GPT2 تیون شده روی زبان فارسی باشه، اما خب بعد از کمی تحقیق و تفحص در مورد این مدل، فهمیدم که خیلی پیشتر از ما، افرادی بودند که این مدل رو با زبان فارسی تیون کنند.
حقیقتا GPT2 هرقدر هم ساختار خوبی داشت، ظاهرا مدل مناسبی برای این موضوع نبود!
اما راهحل رو کمی بعدتر، پیدا کردیم. در ادامه، قراره در مورد این راهحل صحبت کنیم و ببینیم که مارال چیه و چه مزایایی داره و برای توسعه بهترش، باید چه کارهایی کنیم.
مارال چیه؟
مارال، یک مدل بزرگ زبانی یا LLM بر مبنای مدل Mistral 7B (لینک) و تیونشده برای زبان فارسیه. این مدل، به صورت «پیروی از دستورالعمل» یا Instruction Following کار میکنه و نتایجی که تولید میکنه هم تقریبا همارز GPT-3.5 هستند.
مارال در حال حاضر در نسخه ۷ میلیارد پارامتری عرضه میشه، همچنین به صورت یک adapter برای Mistral هم قابل استفادهست که اگر شما پیشتر مدل میسترال رو جایی داشته باشید، صرفا با استفاده از آداپتور مارال، بتونید ازش استفاده کنید.
همچنین مدل و جزییاتش در این لینک موجودند.
مزایای مارال نسبت به مدلهای فارسی قبلی چیه؟
برای درک این موضوع، باید تا حد زیادی عقب بریم. ببینیم اصلا از کِی، بحث پردازش زبان طبیعی یا NLP فارسی، خیلی داغ شد. راستش رو بخواهید از زمانی که شخصا به یاد دارم، بحث پردازش و نمایش زبان فارسی، بحث داغی بود.
حتی میشه گفت چالشهای بسیار زیادی هم در این حوزه وجود داشت. کمکم با پیشرفت اینترنت، این موضوع هم بهبود پیدا کرد. ناگفته نماند که البته حتی حضور فونتهای آزاد فارسی مانند وزیرمتن (جا داره اینجا هم یادی کنیم از صابر راستیکردار عزیز) هم تاثیر بسزایی در این امر گذاشتند.
اما بحث Text Generation چطور؟ این بحث به صورت خاص در همون سالهای ۲۰۱۶ تا ۲۰۱۸ که در دنیا مدلهای LSTM و GPT-2 خیلی مطرح بودند، پا گرفت. بسیاری از اشخاص و شرکتهای ایرانی، به سمت تولید مدل رفتند. در ادامه، دوتا از این مدلها که «اختصاصا» برای زبان فارسی ساخته شدند رو بررسی و مشکلاتشون هم مطرح میکنم.
مدلهای تجاری
در حال حاضر، تنها مدلی که به صورت تجاری در دسترسه، مدل وبسایت «خودنویس»ئه که خب، این مدل علیرغم این که خروجیهای بسیار خوبی میتونه تولید کنه، تجاریه و نمیشه خیلی بررسی دقیقی روش داشت.
علاوه بر اون، خروجیهایی که تولید میکنه من رو یاد خروجی مدلهایی مانند GPT NeoX 20B و GPT J 6B میندازه و خب با توجه به قدمت این وبسایت، این موضوع کاملا طبیعیه.
یکی از مشکلاتی که مدلهایی مثل GPT J دارند، اینه که علاقه خاصی به تکرار خودشون دارند، البته این مشکل تا حدی هم به Tokenizer های مدلها برمیگرده که برای زبان فارسی، مناسبسازی نشدند.
مدلهای آزاد
اما در حین جستجو، تونستم دو مدل آزادی که اختصاصا برای فارسی ترین شدند رو پیدا کنم که در ادامه در موردشون کمی توضیح خواهم داد.
- مدل ParsGPT: این مدل، دقیقا GPT2 اون هم نسخه ۱۴۲ میلیون پارامتری بود که روی دیتای فارسی ترین شده، گرچه دقت نسبتا خوبی در تولید محتوای فارسی داره، اما دو تا مشکل بزرگ داشت. اول، این که طبق معمول عادت به تکرار خودش داره (این مساله رو در ادامه در موردش صحبت خواهم کرد) و دوم این که از یه جایی به بعد، دقیقا مطالب بیربط به پرامپتی که داده شده تولید میکنه. مثلا ممکنه از یه مطلبی پیرامون هوش مصنوعی، برای شما متن یک خبر مرتبط با وزارت خارجه بورکینافاسو تولید کنه!
- مدل GPT2 Medium Persian: این مدل باز کمی بهتر بود. مدل بزرگتر و با حدود ۳۰۰ میلیون پارامتر. اما مشکل به طور واضح، دیتایی بود که مدل باهاش pretrain شده. به قول معروف روی «آشغالهای سئوشده وب فارسی» ترین شده و احتمال این که مطالب خلاف واقع تولید کنه بسیار بالاست. گذشته از این، هنوز مشکل تولید محتوای بیربط هم در این یکی مدل به چشم میخورد.
پس راهحل این بود که یک مدل جدیدتر با پایه جدیدتر ساخته بشه. خوشبختانه دوستی به نام سینا رشیدی، دادگان آلپاکای فارسی رو ایجاد کرده که ازش برای ترین کردن این مدل، استفاده کردیم.
و اگر بخواهیم مزایای مارال رو نسبت به مدلهای پیشین بگیم:
- دیتاست بهتر
- پارامترهای بیشتر
- مدل پایه جدیدتر
- خروجیهای بهتر
خواهند بود.
مزایای مارال نسبت به مدل پایهش (Mistral 7B) چیه؟
اولین روزی که از میسترال استفاده کردم متوجه شدم نسبت به مدلهای قبلی مثل LLaMa, LLaMa2, StableLM 7B و Vicuna و امثالهم، درک بهتری از الفبای فارسی/عربی داره.
این نشان از این بود که این مدل، قابلیت فهمیدن فارسی داره ولی به قدر کافی مطلب فارسی ندیده. به همین خاطر دست به فاینتیون کردنش روی دیتاست فارسی زدم.
مزیت این مدل نسبت به میسترال، اینه که فارسی رو از لحاظ ساختار و معنا درستتر میفهمه و میتونه خروجی بسیار بهتری در زبان فارسی تولید کنه. نکته جالب اینه که زبان انگلیسی هم همچنان میفهمه، پس یک مدل Bilingual داریم که میتونیم در آینده، ازش استفادههای باحالی کنیم.
بذارید خیلی خلاصه بگم، مارال، تمام خوبیهای میسترال رو داره بعلاوه درک خوبی از زبان شیرین فارسی. البته ناگفته نماند که در بخش بعدی مشکلاتی که در نسخه آلفا داشتیم رو هم لیست کردم و براتون نوشتم 🙂
در حال حاضر چه مشکلاتی ممکنه در استفاده از مارال پیش بیاد؟
- مدل در هذیانگویی (Hallucination) بسیار خوبه. البته، این مشکل تقریبا تمام مدلهای زبانیه و با گذر زمان، میشه حلش کرد.
- مدل علاقه زیادی به تکرار خودش داره 😁
- نتایج مدل در حال حاضر خیلی factual نیستند و میتونه misinformation تولید کنه.
- مدل خیلی بزرگه و با همه سختافزارها قابل اجرا نیست (البته با کد ۸ بیتی که ارائه کردیم قابل اجرا میشه)
- فرمت پرامپتش، کمی مناسب نیست و نیازه که شروع و پایان جملات به مدل آموزش داده شه.
چه چیزی برای توسعه بهتر مارال لازمه؟
- دیتاست بهتر (نه الزاما بزرگتر) و حتی شاید دیتاستهای تخصصی
- ترین شدن tokenizer روی زبان فارسی
چطور از مارال استفاده کنم؟
چنانچه قصد دارید از مارال استفاده کنید، کدهای اجرای مارال روی GPU رو در این لینک قرار دادیم. میتونید این کدها رو روی سیستم خودتون یا در Google Colab اجرا کنید.
جمعبندی
پس از این که یک ترین موفق روی Stable Diffusion و ساخت مدل «مانی» که البته در این مطلب در موردش توضیح داده بودم، باعث شد که پلتفرم هوش مصنوعی مانی رو راهاندازی کنم و به نوعی یک AI company تشکیل بدم، مسیرم به شکلی تغییر کرد که پشتیبانی بهتر و بهتر از زبان شیرین فارسی رو بتونم به این مدلها اضافه کنم.
در حال حاضر، کاربردهای زیادی برای مدل بزرگ زبانی فارسی مانند مارال میشه متصور شد. گذشته از رباتهای پشتیبان (که با متد RAG ساخته میشن) میشه به کاربردهای بسیار بیشتری هم برای این مدل فکر کرد. دوست دارم بدونم شما چه فکری در مورد این مدل دارید؟
در پایان هم ممنونم از وقتی که گذاشتید و این مطلب رو خوندید. امیدوارم این مطلب، برای شما مفید بوده باشه. موفق و موید باشید 🙂
#جبیر #جبیری #حقیری #حقیریقزوینی #کامپیوتر #متنباز #محمدرضاحقیری #نرمافزارآزاد #نرمافزارمتنباز #هوشمصنوعی #یادگیریعمیق #یادگیریماشین
-
فعلا هیچی. میخوام تحقیق کنم ببینم ریاضیات محض یا علوم کامپیوتر مناسب من هست یا نه. البته که به جفتشون علاقه دارم ولی دلیل نمیشه که تحصیل ریاضیات محض توی سیستم دانشگاهی ایران هم مناسب من باشه. همونطور که من برنامهنویسم ولی مهندسی کامپیوتر توی دانشگاه مناسبم نبود.
-
CW: نوستالژی کامپیوتر (متن طولانی)
#فلش_بک #خاطره #نوستالژی
یادمه اولین کامپیوتری که خریدیم، کیسی شبیه به این عکس داشت. روش #ویندوز ۹۸ پارسا ۹۹ نصب بود. :win3: البته مثل همیشه و طبق روال ثابت خونه ما، #کامپیوتر مال برادر بزرگتر بود و هروقت که بزرگوار دیگه به مرحله سرگیجه می رسید، نوبت ما بود که باید از وقت باقی مونده نهایت استفاده رو می کردیم. برخلاف برادر بزرگم حامد، که عمده فعالیتش به نوشتن متن های عاشقانه و لوس برای دوست دختر نداشتهی خیالیش توی برنامه وُرد محدود می شد، من و برادر دیگم محمد به معنای واقعی کلمه دمار از روزگار اون سیستم بخت برگشته در می آوردیم. :win3_control_panel: هر برنامه ای که روی سیستم بود رو اجرا می کردیم که بفهمیم کارش چیه. ویندوز ۹۸ هم که برای خراب شدن منتظر یه تلنگر بود. اما مشکلات از زمانی شروع شد که برنامه های توی استارت منو و دسکتاپ همه باز شد، دیده شد، خیلی پسندیده شد و ما برای کرم ریختن رفتیم سراغ دایرکتوری ویندوز و هر فایل اجرایی ای که می دیدیم اجرا می کردیم. :win3_progman: البته همونطور که گفتم خود ویندوز ۹۸ اونقدر مزخرف بود که بخاطر خراب شدنش خطری متوجه ما نشه...
اون موقع خونهی ما در محله بلوردی شیراز بالا ترین نقطه توی کوچه سوم خرداد بود. یعنی چند تا کوچه با خوابگاه دانشگاه ارم فاصله داشتیم. بالای کوه! هربار که سیستم مورد عنایت ما قرار می گرفت، باید کیس رو برمی داشتیم و به نزدیکترین خدمات کامپیوتری می بردیم و ویندوز نصب می کردیم. از اونجایی که در کل خاندان پدری و مادری ما نه کسی کامپیوتر داشت و نه کسی دانشی ازش داشت، مدتی زمان برد تا از خدمات کامپیوتری بی نیاز شیم. بالاخره حامد یاد گرفت ویندوز نصب کنه و تبدیل شد به حلال مشکلات ویندوزی خانواده و دوستان. :win3_setup:
نمی دونم علتش چی بود؟ ولی حامد مثل #مایکروسافت سیاست #انحصار رو در پیش گرفته بود و چیزی به ما یاد نمی داد. ولی ما هم بی کار ننشسته بودیم و بواسطه ماجراجویی هایی که با سیستم داشتیم، کلی چیز بلد بودیم که حامد روحشم خبر نداشت. انگار حامد #کرنل #لینوکس رو داشت و ما سیستم عامل #گنو رو که فقط به یک کرنل احتیاج داشت. شیفت مدرسه من و محمد مخالف با شیفت حامد بود. حامد برای اینکه ما در غیابش از سیستم استفاده نکنیم، روی بایوس رمز گذاشته بود. اما من باگش رو از یکی از همکلاسی هام یاد گرفته بودم. پسورد بایوس مادربورد های قدیمی، با وارد کردن کاراکتر * بجای رمز اصلی پاس می شد. به این ترتیب ما آزاد بودیم بدون نظارت استصوابی حامد، هر کاری که دوست داشتیم انجام بدیم. یکی از همون روز ها من و محمد ویندوز رو فرستادیم هوا و از ترس اینکه بعد از برگشتن حامد کتک بخوریم و برای مدت مدیدی از سیستم محروم بشیم، با چیز های جسته و گریخته ای که موقع نصب ویندوز توسط حامد دزدکی دیده بودیم، شروع کردیم به ویندوز نصب کردن. :win3_cdrom:
چندین بار ویندوز رو نصب کردیم و خراب بود تا اینکه با آزمون و خطا، بالاخره موفق شدیم یه ویندوز درست رو با درایور ها و سایر برنامه ها نصب کنیم و نصب ویندوز رو هم یاد گرفتیم...
یادش بخیر!
:win3_shut_down: