وبلاگ / هوش مصنوعی هرمس(Hermes): ایجنتی که یاد میگیرد، به خاطر میسپارد و هر روز بهتر میشود
هوش مصنوعی هرمس(Hermes): ایجنتی که یاد میگیرد، به خاطر میسپارد و هر روز بهتر میشود
مقدمه
تصور کنید هر بار که یک ابزار هوش مصنوعی باز میکنید، مجبور باشید از صفر توضیح بدهید که کی هستید، روی چه پروژهای کار میکنید، چه فرمتی دوست دارید و چه اصطلاحاتی در کارتان رایج است. این دقیقاً مشکل اصلی اکثر ابزارهای هوش مصنوعی امروزی است؛ قابلیتهای شگفتانگیز دارند، اما حافظه ندارند.
Hermes — ایجنت هوش مصنوعی متنباز ساختهشده توسط NousResearch — این مشکل را از ریشه حل کرده است. هرمس نهتنها به خاطر میسپارد، بلکه از تجربیات گذشته یاد میگیرد، مهارتهای قابلاستفاده مجدد میسازد و با هر بار استفاده، واقعاً بهتر میشود. این مقاله به بررسی عمیق هرمس — از مدلهای زبانی آن تا Hermes Agent — میپردازد و نشان میدهد چرا این پروژه متنباز در حال تغییر قواعد بازی است.
NousResearch کیست و هرمس از کجا آمد؟
NousResearch یک کلکتیو پژوهشی هوش مصنوعی است که چند سال است روی fine-tuning مدلهای زبانی متنباز تمرکز دارد. آنها سری مدلهای Hermes را بر پایه معماریهای Llama و Mistral توسعه دادهاند و در میان توسعهدهندگانی که میخواهند مدلهای قوی را روی سرور خودشان اجرا کنند — بدون اینکه دادههایشان به APIهای اختصاصی ارسال شود — محبوبیت زیادی کسب کردهاند.
نسلهای هرمس یک مسیر تکاملی مشخص داشتهاند:
- Hermes 2: نسل اولیه که پایههای fine-tuning با دادههای سنتتیک را بنا گذاشت
- Hermes 3: بر پایه Llama 3.1، با اندازههای 8B، 70B و 405B، با تمرکز بر reasoning عمیق، خلاقیت و function calling پیشرفته
- Hermes 4: نسل جدید با قابلیت Hybrid Reasoning و ۵۰ برابر داده بیشتر نسبت به Hermes 3
- Hermes 4.3: اولین مدلی که با شبکه分散Psyche آموزش دیده، با پنجره کانتکست ۵۱۲K توکن
- Hermes Agent: یک ایجنت هوش مصنوعی کامل که در فوریه ۲۰۲۶ منتشر شد
این مسیر نشاندهنده یک چشمانداز مشخص است: مدلی که نه فقط جواب میدهد، بلکه واقعاً کار میکند.
مدلهای زبانی هرمس: از Hermes 3 تا Hermes 4.3
Hermes 3؛ پایهای که هنوز مرتبط است
Hermes 3 با fine-tuning روی Llama 3.1 ساخته شد و یکی از قابلیتهای اصلی آن، پیروی دقیق از دستورالعملهای کاربر بود — نه دستورالعملهای یک شرکت. این تمایز مهم است: در حالی که مدلهای تجاری مانند GPT-4o اغلب سوالاتی را به دلایل اخلاقی رد میکنند، Hermes 3 طراحی شده تا دقیقاً آنچه از آن خواسته میشود را انجام دهد — از نوشتن محتوای تخصصی تا function calling پیچیده و تولید JSON ساختاریافته.
قابلیتهای کلیدی Hermes 3:
- حفظ کانتکست بلندمدت (128K توکن)
- مدیریت مکالمات چندمرحلهای
- قابلیتهای agentic و function calling از طریق تگهای XML
- Retrieval Augmented Generation با استناددهی
برای آشنایی بیشتر با RAG که یکی از مکانیزمهای اصلی این مدلهاست، مقاله راهنمای جامع RAG در هوش مصنوعی را بخوانید.
Hermes 4؛ وقتی استدلال هیبریدی وارد بازی میشود
Hermes 4 در اوت ۲۰۲۵ منتشر شد و یک قابلیت اساسی اضافه کرد: Hybrid Reasoning Mode. این یعنی مدل میتواند بین پاسخ سریع و تفکر گامبهگام عمیق سوئیچ کند. وقتی یک مسئله پیچیده میدهید، با یک تگ
<think> مدل وارد حالت تفکر میشود و مسیر استدلالش را قبل از پاسخ نهایی طی میکند — دقیقاً مانند یک انسان که قبل از جواب دادن فکر میکند.نتایج بنچمارک Hermes 4 (نسخه 405B) حرفهای بزرگی میزند:
- MATH-500: 96.3% در حالت reasoning
- AIME'24: 81.9% (که با سیستمهای اختصاصی گرانقیمت رقابت میکند)
- RefusalBench: 57.1% — بالاترین امتیاز در میان تمام مدلهای آزمودهشده
برای مقایسه، GPT-4o در RefusalBench 17.67% و Claude Sonnet 4 نیز 17% گرفت. این یعنی Hermes 4 به مراتب کمتر از مدلهای رقیب سوالات کاربران را رد میکند.
این مفهوم با مدلهای استدلالی هوش مصنوعی که در deepfa.ir توضیح دادهایم، ارتباط مستقیم دارد.
Hermes 4.3؛ نخستین مدل آموزشدیده روی شبکه توزیعشده
Hermes 4.3 یک نقطه عطف تاریخی است: اولین مدل Hermes که با شبکه توزیعشده Psyche آموزش دیده. Psyche یک شبکه آموزشی غیرمتمرکز است که از بهینهساز DisTrO استفاده میکند تا نودهای پردازشی پراکنده در سراسر جهان را — با امنیت blockchain سولانا — در یک فرآیند آموزشی واحد هماهنگ کند.
این نهتنها از نظر فنی جذاب است، بلکه یک پیام مهم دارد: آموزش مدلهای بزرگ دیگر نیازی به مراکز داده غولپیکر ندارد.
بنچمارکهای Hermes 4.3 (36B):
| بنچمارک | Hermes 4.3 (36B) | توضیح |
|---|---|---|
| MATH-500 | 93.8% | مسائل ریاضی پیچیده |
| MMLU | 87.7% | دانش عمومی چند حوزهای |
| BBH (Big-Bench Hard) | 86.4% | استدلال پیچیده |
| AIME 24 | 71.9% | المپیاد ریاضی دانشگاهی |
| GPQA Diamond | 65.5% | سوالات تخصصی دکترا |
| RefusalBench | 74.6% | نرخ پاسخگویی (بالاتر = بهتر) |
نکته جالب: Hermes 4.3 با ۳۶ میلیارد پارامتر در چندین بنچمارک از Hermes 4 با ۷۰ میلیارد پارامتر بهتر عمل میکند. این پنجره کانتکست ۵۱۲K توکن — که با مکانیسم توجه پیشرفته ممکن شده — یعنی میتوانید کل یک کدبیس متوسط را در یک بار به مدل بدهید.
Hermes Agent؛ وقتی مدل تبدیل به یک دستیار واقعی میشود
تفاوت بین یک چتبات و یک ایجنت را در یک مثال ساده ببینید:
چتبات: میتواند توضیح دهد چطور یک ریپو گیتهاب را بررسی کنید.Hermes Agent: ریپو را بررسی میکند، فایلها را جستجو میکند، تستها را اجرا میکند، داکیومنت را ویرایش میکند، یک برنامه زمانبندی میسازد و آنچه یاد گرفته را برای دفعه بعد به خاطر میسپارد.
Hermes Agent در فوریه ۲۰۲۶ توسط NousResearch منتشر شد و با بیش از ۳۲ هزار ستاره گیتهاب، به یکی از پرطرفدارترین پروژههای ایجنت متنباز تبدیل شده است.
معماری حافظه سهلایه
قلب Hermes Agent یک سیستم حافظه منحصربهفرد است. برخلاف ابزارهایی که با هر سشن از صفر شروع میکنند، Hermes از سه لایه حافظه استفاده میکند:
۱. حافظه اپیزودیک (Episodic Memory)
ایجنت تجربیات گذشته خود را ذخیره میکند. اگر در یک وظیفه اشتباه کرد، این اشتباه در حافظه ثبت میشود و دفعه بعد رویکرد متفاوتی امتحان میکند. مثال واقعی: اگر روز اول در طبقهبندی ایشوهای گیتهاب منطق اشتباهی داشت، تا روز سوم خودش را اصلاح میکند.
۲. مدل کاربر (User Model)
فایل USER.md یک پروفایل دائمی از ترجیحات شما میسازد: زبان مورد نظر، فرمت خروجی دلخواه، اصطلاحات تخصصیتان، محدودیتهایی که دارید. این اطلاعات بین تمام sessionها حفظ میشود.
۳. کتابخانه مهارتها (Skill Library)
وقتی Hermes یک وظیفه پیچیده را انجام میدهد، رویکردش را به عنوان یک فایل Markdown مستند میکند. دفعه بعد که وظیفه مشابهی بدهید، به جای اینکه از صفر شروع کند، مهارت ذخیرهشده را بارگذاری میکند. این یعنی سرعت بیشتر + هزینه کمتر.
این معماری ارتباط مستقیمی با مفهوم شبکههای عصبی تقویت شده با حافظه دارد که در سطح معماری هوش مصنوعی مطرح است.
قابلیتهای Hermes Agent که واقعاً متفاوت است
بیش از ۴۰ ابزار داخلی
Hermes Agent با ۴۰+ ابزار داخلی میآید که شامل میشود:
- مرورگر وب: جستجو، استخراج محتوا، اتوماسیون کامل مرورگر (کلیک، تایپ، اسکرینشات)
- اجرای کد: محیط sandbox برای اجرای امن کد
- مدیریت فایل: خواندن، نوشتن، ویرایش فایلها
- ترمینال از راه دور: اجرای دستورات روی سرور
- API calls: ارتباط با سرویسهای خارجی
- تحلیل تصویر، تبدیل گفتار به متن، تولید تصویر
سازگاری با همه مدلهای بزرگ
یکی از هوشمندانهترین تصمیمات طراحی Hermes Agent، مستقل بودن آن از مدل است. میتوانید با یک تغییر ساده در فایل .env بین GPT-5، Claude Opus 4.6، مدلهای محلی Ollama و هر endpoint سازگار با OpenAI سوئیچ کنید — بدون اینکه هیچ چیز دیگری تغییر کند. مهارتها، حافظه و مدل کاربر همه حفظ میشوند.
این انعطافپذیری یعنی میتوانید وظایف ارزان را به مدلهای محلی و وظایف پیچیده را به مدلهای frontier بسپارید — و هزینه را بهینه کنید.
برای آشنایی با مفهوم ایجنتهای هوش مصنوعی، مطالعه مقاله ایجنت هوش مصنوعی میتواند پایه خوبی بسازد.
پشتیبانی از MCP
Hermes Agent از پروتکل MCP (Model Context Protocol) پشتیبانی میکند که ارتباط هوش مصنوعی با دنیای واقعی را ممکن میسازد. این یعنی Hermes میتواند مستقیماً با ابزارهای خارجی مانند Asana، Slack، GitHub و دیگر سرویسها ارتباط برقرار کند.
یکپارچگی با پیامرسانها
Hermes به CLI، Telegram، Discord، Slack، WhatsApp، Signal و Email متصل میشود — همه با یک معماری مشترک. یعنی میتوانید از طریق تلگرام یک task بدهید، Hermes آن را انجام دهد و نتیجه را همانجا برگرداند.
مثالهای واقعی: Hermes Agent در عمل
مثال ۱: اتوماسیون روزانه توسعهدهنده
یک توسعهدهنده این گردش کار را راهاندازی کرده است:
هر صبح، ایشوهای جدید گیتهاب را بر اساس شدت طبقهبندی کن، خلاصه کوتاهی بنویس و در کانال Slack تیم پست کن.
این task یک بار تعریف میشود و با cron هر روز اجرا میشود. اگر اول در منطق طبقهبندی خطا کرد، حافظه اپیزودیک آن را ثبت میکند و تا روز سوم به خودی خود اصلاح میشود.
مثال ۲: مرور ادبیات پژوهشی
یک محقق از Hermes برای مرور ادبیات استفاده میکند:
- Hermes مقالاتی را که قبلاً خوانده به خاطر میسپارد
- هر مقاله را با فرمت ثابت خلاصه میکند
- وقتی به موضوع مشابهی برمیگردید، یافتههای قبلی را سطح میآورد
- تناقضها و شکافهای تحقیقاتی را شناسایی میکند
مثال ۳: ساخت پروژه کامل نرمافزاری
یک کاربر گزارش کرده که به Hermes گفته: «یک اپلیکیشن مدیریت کارها (Todo) کامل با احراز هویت بساز و منتشر کن.» Hermes کد نوشته، تستها را اجرا کرده، مشکلات را اشکالزدایی کرده و فرایند انتشار را انجام داده است — و مهارتهای کسبشده در این فرایند را برای پروژههای مشابه بعدی ذخیره کرده است.
مثال ۴: دستیار شخصی روی Raspberry Pi
یک کاربر Hermes را روی Raspberry Pi 4 اجرا کرده و از آن به عنوان مغز مرکزی برای تمام دستگاههایش استفاده میکند. ترجیحات کاربر در تمام دستگاهها به اشتراک گذاشته میشود و Hermes کارها را با آگاهی از بافت کامل زندگی دیجیتال صاحبش انجام میدهد.
این نوع استفاده با مفهوم هوش مصنوعی لبه که پردازش را به لبه شبکه میبرد، کاملاً همسو است.
مقایسه Hermes با رقبا
| ویژگی | Hermes Agent | LangChain/CrewAI | Claude Code / Cursor |
|---|---|---|---|
| حافظه پایدار بین sessionها | ✅ داخلی و سهلایه | ⚠️ نیاز به پیادهسازی دستی | محدود |
| یادگیری خودکار از اشتباه | ✅ loop یادگیری داخلی | ❌ ندارد | ❌ ندارد |
| مدلبودن آگنوستیک | ✅ 200+ مدل | ✅ بله | ❌ محدود به مدل مشخص |
| نصب و راهاندازی | یک دستور curl | ⚠️ پیکربندی پیچیده | ✅ ساده |
| هزینه ماهانه | VPS $5 + هزینه API | متغیر | اشتراک ماهانه ثابت |
| پیامرسانهای خارجی | ✅ Telegram, Slack, Discord, ... | ⚠️ نیاز به توسعه | ❌ ندارد |
| متنباز بودن | ✅ Apache 2.0 | ✅ بله | ❌ اختصاصی |
برای مقایسه دقیقتر فریمورکهای ایجنت، مقاله مقایسه CrewAI، AutoGen و LangChain را بخوانید.
چرا Hermes برای توسعهدهندگان ایرانی جذاب است؟
۱. هزینه بسیار پایین: Hermes Agent روی یک VPS $5 ماهانه اجرا میشود. برخلاف اشتراکهای ماهانه ابزارهای تجاری، شما فقط هزینه API ای را میپردازید که واقعاً مصرف میکنید.
۲. کنترل کامل بر داده: چون بهصورت self-hosted اجرا میشود، دادههای شما — کدها، اسناد تجاری و پروژهها — از زیرساخت و سرورهای خودتان خارج نمیشوند.
۳. قابلیت اجرا با مدلهای محلی: با Ollama میتوانید Hermes 4.3 را کاملاً آفلاین روی یک سیستم با GPU مناسب اجرا کنید — بدون نیاز به هیچ API خارجی.
۴. بدون سانسور بیش از حد: یکی از شکایات رایج از مدلهای تجاری این است که بسیاری از سوالات کاملاً قانونی و مرتبط با کار را رد میکنند. Hermes طراحی شده تا ابتدا به کاربر پاسخ دهد.
محدودیتهایی که باید بدانید
صادقانه بگوییم: Hermes Agent هنوز در مراحل اولیه است.
- داکیومنتیشن: مستندات هنوز کامل نیستند و برخی قابلیتها نیاز به آزمون و خطا دارند
- جامعه کوچکتر: در مقایسه با LangChain یا Claude Code، جامعه کوچکتری دارد
- وابستگی به مدل backend: کیفیت خروجی به مدلی که به آن متصل میکنید بستگی دارد
- منحنی یادگیری: راهاندازی اولیه برای کاربران غیر فنی ممکن است چالشبرانگیز باشد
چشمانداز آینده: Psyche و آموزش غیرمتمرکز
یکی از جذابترین جنبههای NousResearch، شبکه Psyche است. این شبکه اثبات میکند که میتوان مدلهای بزرگ را بدون یک مرکز داده یکجا — با نودهایی در سراسر دنیا — آموزش داد. این مفهوم مستقیماً با یادگیری فدرال و حریم خصوصی در هوش مصنوعی مرتبط است.
اگر Psyche بتواند در مقیاس بزرگتر ثابت کند، ممکن است مسیر توسعه مدلهای بزرگ را برای همیشه تغییر دهد — از انحصار شرکتهای بزرگ به یک مدل واقعاً توزیعشده.
همچنین روند رو به رشد ایجنتهای خودمختار هوش مصنوعی نشان میدهد که Hermes Agent در مسیر درستی حرکت میکند.
جمعبندی
هرمس — هم در قالب مدلهای زبانی و هم Hermes Agent — یک پروژهای است که نشان میدهد متنباز بودن با قدرت تجاری لازم نیست در تناقض باشد.
Hermes 4 با بنچمارکهای ریاضی که با مدلهای اختصاصی گرانقیمت رقابت میکند، و Hermes Agent با معماری حافظه سهلایهاش که واقعاً یاد میگیرد — این خانواده مدلی چیزی ارائه میدهد که جای دیگری پیدا نمیکنید: یک ایجنت هوش مصنوعی که هر روز که با آن کار میکنید، کارآمدتر میشود.
اگر توسعهدهنده هستید، محقق هستید، یا فقط میخواهید یک دستیار هوش مصنوعی داشته باشید که واقعاً حافظه داشته باشد — Hermes Agent ارزش امتحان کردن را دارد.
برای درک بهتر چشمانداز کلی هوش مصنوعی و مدلهای زبانی بزرگ، میتوانید مقاله مدلهای زبانی هوش مصنوعی را در دیپفا بخوانید.