در دنیای پرهیاهوی هوش مصنوعی که هر روز منتظر خبری جدید از غولهایی مثل OpenAI و Google هستیم، یک استارتاپ کوچک در سنگاپور، بیسروصدا بمبی را منفجر کرده است. این خبر، معرفی یک معماری جدید هوش مصنوعی به نام HRM است که میتواند معادلات قدرت را به کلی تغییر دهد. اگر شما هم از علاقهمندان به دنیای تکنولوژی در سایت میناوا هستید، با ما همراه باشید تا ببینیم این مدعی جدید چه در چنته دارد.
برخلاف تصور، HRM نه مدل بزرگتری است و نه با دادههای بیشتری آموزش دیده. در عوض، ساختار آن کاملاً متفاوت است. این مدل که از ساختار مغز انسان الهام گرفته، با وجود اندازهی بسیار کوچکش، مدلهایی را که چهار برابر بزرگتر هستند، به راحتی پشت سر میگذارد. فکرش را میکردید؟
HRM چیست؟ معرفی هوش مصنوعی که میخواهد بازی را عوض کند.
قبل از اینکه فکر کنید این هم یکی دیگر از آن تیترهای زرد “مدل کوچک، GPT را شکست داد” است، باید بگوییم که این بار قضیه جدی است! HRM یک مدل زبان بزرگ (LLM) کوچکشده یا نسخهی رژیمی ChatGPT نیست. این مدل یک معماری جدید هوش مصنوعی است که به معنای واقعی کلمه، استراتژی تصمیمگیری لایهای مغز را در استدلال هوش مصنوعی پیادهسازی کرده است.
این ساختار شگفتانگیز به یک مدل با تنها ۲۷ میلیون پارامتر اجازه میدهد تا مدلهایی با بیش از ۱۰۰ میلیون یا حتی میلیاردها پارامتر را در بنچمارکهای استدلال شکست دهد. برای اینکه مقیاس را درک کنید:
- مدل GPT-۱ دارای ۱۱۷ میلیون پارامتر بود.
- مدل HRM تنها ۲۷ میلیون پارامتر دارد (کمتر از یکچهارم!).
اما با همین ابعاد کوچک، در بنچمارکهای استدلال از مدلهایی مثل Claude ۳.۷ و مدل ۰۳-mini-high از OpenAI عملکرد بهتری داشته است. این دستاورد حاصل کار استارتاپ Sapien.AI است که تیمی از مهندسان سابق DeepMind، Anthropic و حتی XAI ایلان ماسک را گرد هم آورده است.
خداحافظی با «زنجیره تفکر» و سلام به استدلال انسانی!
مدلهای امروزی مثل ChatGPT برای حل مسائل از روشی به نام «زنجیره تفکر» (Chain of Thought) استفاده میکنند. یعنی مسئله را مرحله به مرحله برای خودشان توضیح میدهند. این روش هوشمندانه به نظر میرسد، اما یک مشکل بزرگ دارد: اگر فقط یک اشتباه کوچک در یکی از مراحل این زنجیره رخ دهد، کل پاسخ فرو میریزد.
اما HRM این روش را کاملاً کنار گذاشته است. این مدل به جای امید به پاره نشدن زنجیره، مانند یک انسان فکر میکند: ابتدا استراتژی میچیند و سپس به سرعت اجرا میکند. اما چطور؟
هوش مصنوعی الهام گرفته از مغز چگونه کار میکند؟
جادوی HRM در معماری دو بخشی آن نهفته است که مدام با یکدیگر در ارتباط هستند. این هوش مصنوعی الهام گرفته از مغز از دو جزء اصلی تشکیل شده است:
- برنامهریز سطح بالا (The Planner): این بخش مانند مغز استراتژیک و کند ما عمل میکند. تصویر بزرگ را میبیند، نوع مسئله را تشخیص میدهد و یک نقشه راه کلی طراحی میکند.
- کارگر سطح پایین (The Worker): این بخش پردازنده سریع سیستم است. دستورات را از برنامهریز میگیرد و کار را با سرعت و دقت بالا انجام میدهد.
این دو بخش در یک حلقه با هم کار میکنند. برنامهریز یک نقشه میکشد، کارگر آن را اجرا میکند و نتیجه را برمیگرداند. سپس برنامهریز بر اساس بازخورد، نقشه را اصلاح میکند و این چرخه آنقدر ادامه پیدا میکند تا مدل به پاسخ نهایی و بهینه برسد. این ویژگی به مدل اجازه میدهد تا استدلال خود را در حین فرآیند، بررسی و اصلاح کند؛ قابلیتی که اکثر مدلهای دیگر فاقد آن هستند. این رویکرد به جای تقلید کورکورانه، واقعاً شبیه به تفکر است.
نتایج شگفتانگیز در عمل: HRM در برابر غولها!
حالا بیایید ببینیم این معماری جدید هوش مصنوعی در عمل چطور بوده. نتایج واقعاً دیوانهکننده است! برای مقایسه بهتر، عملکرد HRM را با رقبای بزرگش در یک جدول ببینیم:
| آزمون | امتیاز HRM (۲۷M پارامتر) | امتیاز Claude/OpenAI (میلیونها پارامتر) |
|---|---|---|
| بنچمارک ARC-AGI (تست IQ هوش مصنوعی) | ۴۰.۳% | ۲۱.۲% و ۳۴.۵% |
| حل سودوکو (سطح سخت و دشوار) | ۵۵% | ۰% (هیچکدام!) |
| چالش ماز (پیدا کردن مسیر بهینه) | ۷۴.۵% | ۰% |
اینها تفاوتهای جزئی نیستند! یک مدل کوچک که روی یک کارت گرافیک اجرا میشود، بزرگترین نامهای این صنعت را در استدلال خام شکست داده است. آیا این موضوع شما را هم به فکر فرو برده که شاید آینده هوش مصنوعی در گرو مدلهای بزرگتر نباشد؟ شاید وقت آن رسیده که با شخصیتهای سفارشی ChatGPT خداحافظی کنیم و منتظر ابزارهای واقعاً متفکر باشیم.
آموزش در چند ساعت، نه چند ماه!
صبر کنید، هنوز تمام نشده! تمام این نتایج در حالی به دست آمده که HRM برای هر تسک تنها با ۱۰۰۰ مثال آموزش دیده است. خبری از دیتاستهای عظیم اینترنتی و ماهها پیشآموزش نیست. به گفتهی یکی از سازندگان، میتوان این مدل را برای حل سودوکو در سطح حرفهای تنها در دو ساعت و با دو کارت گرافیک آموزش داد. این فقط بهینه نیست؛ مسخرهآمیز است!

چرا این معماری جدید هوش مصنوعی یک پیشرفت واقعی است؟
ساختار HRM مشکلات عمیقتری را که مدلهای ترنسفورمر امروزی با آن مواجه هستند حل میکند. مدلهایی مثل GPT برای هر کلمهای که تولید میکنند، مقدار محاسبات ثابتی انجام میدهند. آنها نمیتوانند بگویند: “هی، این سوال سخته، بذار بیشتر فکر کنم!”.
در مقابل، معماری دو سطحی HRM به آن اجازه میدهد تا میزان استدلال خود را بر اساس پیچیدگی مسئله تطبیق دهد. این ویژگی آن را به تفکر انعطافپذیر انسانی بسیار نزدیکتر میکند. علاوه بر این، مصرف حافظه کمتری دارد، سریعتر آموزش میبیند و مقیاسپذیری بهتری دارد. این یعنی میتوان HRM را روی لپتاپ یا حتی رباتها و دستگاههای لبه (Edge Devices) اجرا کرد.
این موضوع فقط یک تئوری نیست. شرکت Sapien.AI уже در حال آزمایش HRM در حوزه سلامت برای تشخیص بیماریهای نادر و در پیشبینی آبوهوای فصلی است که طبق گزارشها به دقت ۹۷٪ دست یافته است.
آینده متعلق به HRM و معماریهای مشابه است؟
گوان وانگ، یکی از مغزهای متفکر پشت HRM، با اطمینان میگوید: “هوش مصنوعی عمومی (AGI) یعنی دادن هوشی در سطح انسان و فراتر از آن به ماشینها. زنجیره تفکر فقط یک میانبر است. چیزی که ما ساختیم، میتواند فکر کند.”
این اعتماد به نفس وقتی با نتایج عملی پشتیبانی میشود، معنای دیگری پیدا میکند. خبر خوب این است که مجبور نیستید حرف آنها را باور کنید؛ کل پروژه اپن سورس است و همین حالا میتوانید آن را در گیتهاب بررسی کنید. این سطح از شفافیت برای پروژهای با این پتانسیل، بسیار نادر است.
البته HRM هنوز در ابتدای راه است و تمرکز آن بر استدلال است، نه چت کردن و نوشتن شعر. اما به عنوان یک اثبات مفهوم، یکی از قویترینهایی است که تا به حال دیدهایم. این نشان میدهد که جهش بزرگ بعدی در هوش مصنوعی، احتمالاً یک کلون بزرگتر از GPT-۵ یا مدلهای مشابهی مثل Grok نخواهد بود، بلکه از یک معماری جدید هوش مصنوعی مانند این سرچشمه میگیرد.
جمعبندی نهایی
در این مقاله به معرفی هوش مصنوعی HRM پرداختیم؛ یک مدل انقلابی که به جای بزرگتر بودن، هوشمندتر بودن را انتخاب کرده است. این مدل با الهام از مغز انسان و با یک معماری دو بخشی، توانسته در وظایف استدلالی، غولهای این حوزه را با منابعی بسیار کمتر شکست دهد. این معماری جدید هوش مصنوعی میتواند آیندهای را رقم بزند که در آن، ایجنتهای هوشمند به جای زندگی در دیتا سنترها، روی لپتاپ و ربات شخصی شما زندگی کنند و به جای تکرار اطلاعات، واقعاً فکر کنند.
نظر شما چیست؟ آیا این مسیر، آیندهی هوش مصنوعی عمومی است؟ نظرات خود را در بخش کامنتها با ما در میان بگذارید و اگر این مقاله برایتان جالب بود، آن را با دوستان خود به اشتراک بگذارید!
سوالات متداول (FAQ)
۱. هوش مصنوعی HRM چیست و چه چیزی آن را متفاوت میکند؟
HRM یک مدل هوش مصنوعی با یک معماری جدید الهام گرفته از مغز است. تفاوت اصلی آن با مدلهایی مثل ChatGPT در ساختار دو بخشی (برنامهریز و کارگر) است که به آن اجازه میدهد به جای دنبال کردن یک زنجیره ثابت، به صورت چرخهای و تطبیقپذیر فکر و استدلال کند.
۲. آیا HRM میتواند جایگزین ChatGPT برای کارهای روزمره شود؟
در حال حاضر خیر. HRM به طور تخصصی برای استدلال (Reasoning) طراحی شده و در این زمینه فوقالعاده است، اما برای کارهای عمومی مانند چت کردن، خلاصهنویسی یا تولید محتوای خلاقانه ساخته نشده است. این یک اثبات مفهوم برای یک معماری جدید است.
۳. بزرگترین مزیت معماری جدید هوش مصنوعی HRM چیست؟
بزرگترین مزیت آن، کارایی فوقالعاده است. این مدل با پارامترهای بسیار کمتر، دادههای آموزشی ناچیز و زمان آموزش کوتاه، عملکردی بهتر از مدلهای بسیار بزرگتر در وظایف استدلالی نشان میدهد. این امر آن را برای استفاده در دستگاههای با منابع محدود مانند لپتاپها یا رباتها ایدهآل میسازد.
۴. آیا این مدل برای عموم در دسترس است؟
بله، یکی از بهترین ویژگیهای پروژه HRM این است که کاملاً متنباز (Open-Source) است. علاقهمندان و توسعهدهندگان میتوانند کد آن را از طریق صفحه رسمی پروژه در گیتهاب دریافت کرده، آن را بررسی و حتی نسخهی خود را آموزش دهند.














