وبلاگ / هوش مصنوعی هرمس(Hermes): ایجنتی که یاد می‌گیرد، به خاطر می‌سپارد و هر روز بهتر می‌شود

هوش مصنوعی هرمس(Hermes): ایجنتی که یاد می‌گیرد، به خاطر می‌سپارد و هر روز بهتر می‌شود

هوش مصنوعی هرمس(Hermes): ایجنتی که یاد می‌گیرد، به خاطر می‌سپارد و هر روز بهتر می‌شود

مقدمه

تصور کنید هر بار که یک ابزار هوش مصنوعی باز می‌کنید، مجبور باشید از صفر توضیح بدهید که کی هستید، روی چه پروژه‌ای کار می‌کنید، چه فرمتی دوست دارید و چه اصطلاحاتی در کارتان رایج است. این دقیقاً مشکل اصلی اکثر ابزارهای هوش مصنوعی امروزی است؛ قابلیت‌های شگفت‌انگیز دارند، اما حافظه ندارند.
Hermes — ایجنت هوش مصنوعی متن‌باز ساخته‌شده توسط NousResearch — این مشکل را از ریشه حل کرده است. هرمس نه‌تنها به خاطر می‌سپارد، بلکه از تجربیات گذشته یاد می‌گیرد، مهارت‌های قابل‌استفاده مجدد می‌سازد و با هر بار استفاده، واقعاً بهتر می‌شود. این مقاله به بررسی عمیق هرمس — از مدل‌های زبانی آن تا Hermes Agent — می‌پردازد و نشان می‌دهد چرا این پروژه متن‌باز در حال تغییر قواعد بازی است.

NousResearch کیست و هرمس از کجا آمد؟

NousResearch یک کلکتیو پژوهشی هوش مصنوعی است که چند سال است روی fine-tuning مدل‌های زبانی متن‌باز تمرکز دارد. آن‌ها سری مدل‌های Hermes را بر پایه معماری‌های Llama و Mistral توسعه داده‌اند و در میان توسعه‌دهندگانی که می‌خواهند مدل‌های قوی را روی سرور خودشان اجرا کنند — بدون اینکه داده‌هایشان به API‌های اختصاصی ارسال شود — محبوبیت زیادی کسب کرده‌اند.
نسل‌های هرمس یک مسیر تکاملی مشخص داشته‌اند:
  • Hermes 2: نسل اولیه که پایه‌های fine-tuning با داده‌های سنتتیک را بنا گذاشت
  • Hermes 3: بر پایه Llama 3.1، با اندازه‌های 8B، 70B و 405B، با تمرکز بر reasoning عمیق، خلاقیت و function calling پیشرفته
  • Hermes 4: نسل جدید با قابلیت Hybrid Reasoning و ۵۰ برابر داده بیشتر نسبت به Hermes 3
  • Hermes 4.3: اولین مدلی که با شبکه分散Psyche آموزش دیده، با پنجره کانتکست ۵۱۲K توکن
  • Hermes Agent: یک ایجنت هوش مصنوعی کامل که در فوریه ۲۰۲۶ منتشر شد
این مسیر نشان‌دهنده یک چشم‌انداز مشخص است: مدلی که نه فقط جواب می‌دهد، بلکه واقعاً کار می‌کند.

مدل‌های زبانی هرمس: از Hermes 3 تا Hermes 4.3

Hermes 3؛ پایه‌ای که هنوز مرتبط است

Hermes 3 با fine-tuning روی Llama 3.1 ساخته شد و یکی از قابلیت‌های اصلی آن، پیروی دقیق از دستورالعمل‌های کاربر بود — نه دستورالعمل‌های یک شرکت. این تمایز مهم است: در حالی که مدل‌های تجاری مانند GPT-4o اغلب سوالاتی را به دلایل اخلاقی رد می‌کنند، Hermes 3 طراحی شده تا دقیقاً آنچه از آن خواسته می‌شود را انجام دهد — از نوشتن محتوای تخصصی تا function calling پیچیده و تولید JSON ساختاریافته.
قابلیت‌های کلیدی Hermes 3:
  • حفظ کانتکست بلندمدت (128K توکن)
  • مدیریت مکالمات چندمرحله‌ای
  • قابلیت‌های agentic و function calling از طریق تگ‌های XML
  • Retrieval Augmented Generation با استناددهی
برای آشنایی بیشتر با RAG که یکی از مکانیزم‌های اصلی این مدل‌هاست، مقاله راهنمای جامع RAG در هوش مصنوعی را بخوانید.

Hermes 4؛ وقتی استدلال هیبریدی وارد بازی می‌شود

Hermes 4 در اوت ۲۰۲۵ منتشر شد و یک قابلیت اساسی اضافه کرد: Hybrid Reasoning Mode. این یعنی مدل می‌تواند بین پاسخ سریع و تفکر گام‌به‌گام عمیق سوئیچ کند. وقتی یک مسئله پیچیده می‌دهید، با یک تگ <think> مدل وارد حالت تفکر می‌شود و مسیر استدلالش را قبل از پاسخ نهایی طی می‌کند — دقیقاً مانند یک انسان که قبل از جواب دادن فکر می‌کند.
نتایج بنچمارک Hermes 4 (نسخه 405B) حرف‌های بزرگی می‌زند:
  • MATH-500: 96.3% در حالت reasoning
  • AIME'24: 81.9% (که با سیستم‌های اختصاصی گران‌قیمت رقابت می‌کند)
  • RefusalBench: 57.1% — بالاترین امتیاز در میان تمام مدل‌های آزموده‌شده
برای مقایسه، GPT-4o در RefusalBench 17.67% و Claude Sonnet 4 نیز 17% گرفت. این یعنی Hermes 4 به مراتب کمتر از مدل‌های رقیب سوالات کاربران را رد می‌کند.
این مفهوم با مدل‌های استدلالی هوش مصنوعی که در deepfa.ir توضیح داده‌ایم، ارتباط مستقیم دارد.

Hermes 4.3؛ نخستین مدل آموزش‌دیده روی شبکه توزیع‌شده

Hermes 4.3 یک نقطه عطف تاریخی است: اولین مدل Hermes که با شبکه توزیع‌شده Psyche آموزش دیده. Psyche یک شبکه آموزشی غیرمتمرکز است که از بهینه‌ساز DisTrO استفاده می‌کند تا نودهای پردازشی پراکنده در سراسر جهان را — با امنیت blockchain سولانا — در یک فرآیند آموزشی واحد هماهنگ کند.
این نه‌تنها از نظر فنی جذاب است، بلکه یک پیام مهم دارد: آموزش مدل‌های بزرگ دیگر نیازی به مراکز داده غول‌پیکر ندارد.
بنچمارک‌های Hermes 4.3 (36B):
بنچمارک Hermes 4.3 (36B) توضیح
MATH-500 93.8% مسائل ریاضی پیچیده
MMLU 87.7% دانش عمومی چند حوزه‌ای
BBH (Big-Bench Hard) 86.4% استدلال پیچیده
AIME 24 71.9% المپیاد ریاضی دانشگاهی
GPQA Diamond 65.5% سوالات تخصصی دکترا
RefusalBench 74.6% نرخ پاسخ‌گویی (بالاتر = بهتر)
نکته جالب: Hermes 4.3 با ۳۶ میلیارد پارامتر در چندین بنچمارک از Hermes 4 با ۷۰ میلیارد پارامتر بهتر عمل می‌کند. این پنجره کانتکست ۵۱۲K توکن — که با مکانیسم توجه پیشرفته ممکن شده — یعنی می‌توانید کل یک کدبیس متوسط را در یک بار به مدل بدهید.

Hermes Agent؛ وقتی مدل تبدیل به یک دستیار واقعی می‌شود

تفاوت بین یک چت‌بات و یک ایجنت را در یک مثال ساده ببینید:
چت‌بات: می‌تواند توضیح دهد چطور یک ریپو گیت‌هاب را بررسی کنید.
Hermes Agent: ریپو را بررسی می‌کند، فایل‌ها را جستجو می‌کند، تست‌ها را اجرا می‌کند، داکیومنت را ویرایش می‌کند، یک برنامه زمان‌بندی می‌سازد و آنچه یاد گرفته را برای دفعه بعد به خاطر می‌سپارد.
Hermes Agent در فوریه ۲۰۲۶ توسط NousResearch منتشر شد و با بیش از ۳۲ هزار ستاره گیت‌هاب، به یکی از پرطرفدارترین پروژه‌های ایجنت متن‌باز تبدیل شده است.

معماری حافظه سه‌لایه

قلب Hermes Agent یک سیستم حافظه منحصربه‌فرد است. برخلاف ابزارهایی که با هر سشن از صفر شروع می‌کنند، Hermes از سه لایه حافظه استفاده می‌کند:
۱. حافظه اپیزودیک (Episodic Memory)
ایجنت تجربیات گذشته خود را ذخیره می‌کند. اگر در یک وظیفه اشتباه کرد، این اشتباه در حافظه ثبت می‌شود و دفعه بعد رویکرد متفاوتی امتحان می‌کند. مثال واقعی: اگر روز اول در طبقه‌بندی ایشوهای گیت‌هاب منطق اشتباهی داشت، تا روز سوم خودش را اصلاح می‌کند.
۲. مدل کاربر (User Model)
فایل USER.md یک پروفایل دائمی از ترجیحات شما می‌سازد: زبان مورد نظر، فرمت خروجی دلخواه، اصطلاحات تخصصی‌تان، محدودیت‌هایی که دارید. این اطلاعات بین تمام session‌ها حفظ می‌شود.
۳. کتابخانه مهارت‌ها (Skill Library)
وقتی Hermes یک وظیفه پیچیده را انجام می‌دهد، رویکردش را به عنوان یک فایل Markdown مستند می‌کند. دفعه بعد که وظیفه مشابهی بدهید، به جای اینکه از صفر شروع کند، مهارت ذخیره‌شده را بارگذاری می‌کند. این یعنی سرعت بیشتر + هزینه کمتر.
این معماری ارتباط مستقیمی با مفهوم شبکه‌های عصبی تقویت شده با حافظه دارد که در سطح معماری هوش مصنوعی مطرح است.

قابلیت‌های Hermes Agent که واقعاً متفاوت است

بیش از ۴۰ ابزار داخلی

Hermes Agent با ۴۰+ ابزار داخلی می‌آید که شامل می‌شود:
  • مرورگر وب: جستجو، استخراج محتوا، اتوماسیون کامل مرورگر (کلیک، تایپ، اسکرین‌شات)
  • اجرای کد: محیط sandbox برای اجرای امن کد
  • مدیریت فایل: خواندن، نوشتن، ویرایش فایل‌ها
  • ترمینال از راه دور: اجرای دستورات روی سرور
  • API calls: ارتباط با سرویس‌های خارجی
  • تحلیل تصویر، تبدیل گفتار به متن، تولید تصویر

سازگاری با همه مدل‌های بزرگ

یکی از هوشمندانه‌ترین تصمیمات طراحی Hermes Agent، مستقل بودن آن از مدل است. می‌توانید با یک تغییر ساده در فایل .env بین GPT-5، Claude Opus 4.6، مدل‌های محلی Ollama و هر endpoint سازگار با OpenAI سوئیچ کنید — بدون اینکه هیچ چیز دیگری تغییر کند. مهارت‌ها، حافظه و مدل کاربر همه حفظ می‌شوند.
این انعطاف‌پذیری یعنی می‌توانید وظایف ارزان را به مدل‌های محلی و وظایف پیچیده را به مدل‌های frontier بسپارید — و هزینه را بهینه کنید.
برای آشنایی با مفهوم ایجنت‌های هوش مصنوعی، مطالعه مقاله ایجنت هوش مصنوعی می‌تواند پایه خوبی بسازد.

پشتیبانی از MCP

Hermes Agent از پروتکل MCP (Model Context Protocol) پشتیبانی می‌کند که ارتباط هوش مصنوعی با دنیای واقعی را ممکن می‌سازد. این یعنی Hermes می‌تواند مستقیماً با ابزارهای خارجی مانند Asana، Slack، GitHub و دیگر سرویس‌ها ارتباط برقرار کند.

یکپارچگی با پیام‌رسان‌ها

Hermes به CLI، Telegram، Discord، Slack، WhatsApp، Signal و Email متصل می‌شود — همه با یک معماری مشترک. یعنی می‌توانید از طریق تلگرام یک task بدهید، Hermes آن را انجام دهد و نتیجه را همانجا برگرداند.

مثال‌های واقعی: Hermes Agent در عمل

مثال ۱: اتوماسیون روزانه توسعه‌دهنده

یک توسعه‌دهنده این گردش کار را راه‌اندازی کرده است:
هر صبح، ایشوهای جدید گیت‌هاب را بر اساس شدت طبقه‌بندی کن، خلاصه کوتاهی بنویس و در کانال Slack تیم پست کن.
این task یک بار تعریف می‌شود و با cron هر روز اجرا می‌شود. اگر اول در منطق طبقه‌بندی خطا کرد، حافظه اپیزودیک آن را ثبت می‌کند و تا روز سوم به خودی خود اصلاح می‌شود.

مثال ۲: مرور ادبیات پژوهشی

یک محقق از Hermes برای مرور ادبیات استفاده می‌کند:
  • Hermes مقالاتی را که قبلاً خوانده به خاطر می‌سپارد
  • هر مقاله را با فرمت ثابت خلاصه می‌کند
  • وقتی به موضوع مشابهی برمی‌گردید، یافته‌های قبلی را سطح می‌آورد
  • تناقض‌ها و شکاف‌های تحقیقاتی را شناسایی می‌کند

مثال ۳: ساخت پروژه کامل نرم‌افزاری

یک کاربر گزارش کرده که به Hermes گفته: «یک اپلیکیشن مدیریت کارها (Todo) کامل با احراز هویت بساز و منتشر کن.» Hermes کد نوشته، تست‌ها را اجرا کرده، مشکلات را اشکال‌زدایی کرده و فرایند انتشار را انجام داده است — و مهارت‌های کسب‌شده در این فرایند را برای پروژه‌های مشابه بعدی ذخیره کرده است.

مثال ۴: دستیار شخصی روی Raspberry Pi

یک کاربر Hermes را روی Raspberry Pi 4 اجرا کرده و از آن به عنوان مغز مرکزی برای تمام دستگاه‌هایش استفاده می‌کند. ترجیحات کاربر در تمام دستگاه‌ها به اشتراک گذاشته می‌شود و Hermes کارها را با آگاهی از بافت کامل زندگی دیجیتال صاحبش انجام می‌دهد.
این نوع استفاده با مفهوم هوش مصنوعی لبه که پردازش را به لبه شبکه می‌برد، کاملاً همسو است.

مقایسه Hermes با رقبا

ویژگی Hermes Agent LangChain/CrewAI Claude Code / Cursor
حافظه پایدار بین session‌ها ✅ داخلی و سه‌لایه ⚠️ نیاز به پیاده‌سازی دستی محدود
یادگیری خودکار از اشتباه ✅ loop یادگیری داخلی ❌ ندارد ❌ ندارد
مدل‌بودن آگنوستیک ✅ 200+ مدل ✅ بله ❌ محدود به مدل مشخص
نصب و راه‌اندازی یک دستور curl ⚠️ پیکربندی پیچیده ✅ ساده
هزینه ماهانه VPS $5 + هزینه API متغیر اشتراک ماهانه ثابت
پیام‌رسان‌های خارجی ✅ Telegram, Slack, Discord, ... ⚠️ نیاز به توسعه ❌ ندارد
متن‌باز بودن ✅ Apache 2.0 ✅ بله ❌ اختصاصی
برای مقایسه دقیق‌تر فریمورک‌های ایجنت، مقاله مقایسه CrewAI، AutoGen و LangChain را بخوانید.

چرا Hermes برای توسعه‌دهندگان ایرانی جذاب است؟

۱. هزینه بسیار پایین: Hermes Agent روی یک VPS $5 ماهانه اجرا می‌شود. برخلاف اشتراک‌های ماهانه ابزارهای تجاری، شما فقط هزینه API ای را می‌پردازید که واقعاً مصرف می‌کنید.
۲. کنترل کامل بر داده: چون به‌صورت self-hosted اجرا می‌شود، داده‌های شما — کدها، اسناد تجاری و پروژه‌ها — از زیرساخت و سرورهای خودتان خارج نمی‌شوند.
۳. قابلیت اجرا با مدل‌های محلی: با Ollama می‌توانید Hermes 4.3 را کاملاً آفلاین روی یک سیستم با GPU مناسب اجرا کنید — بدون نیاز به هیچ API خارجی.
۴. بدون سانسور بیش از حد: یکی از شکایات رایج از مدل‌های تجاری این است که بسیاری از سوالات کاملاً قانونی و مرتبط با کار را رد می‌کنند. Hermes طراحی شده تا ابتدا به کاربر پاسخ دهد.

محدودیت‌هایی که باید بدانید

صادقانه بگوییم: Hermes Agent هنوز در مراحل اولیه است.
  • داکیومنتیشن: مستندات هنوز کامل نیستند و برخی قابلیت‌ها نیاز به آزمون و خطا دارند
  • جامعه کوچک‌تر: در مقایسه با LangChain یا Claude Code، جامعه کوچک‌تری دارد
  • وابستگی به مدل backend: کیفیت خروجی به مدلی که به آن متصل می‌کنید بستگی دارد
  • منحنی یادگیری: راه‌اندازی اولیه برای کاربران غیر فنی ممکن است چالش‌برانگیز باشد

چشم‌انداز آینده: Psyche و آموزش غیرمتمرکز

یکی از جذاب‌ترین جنبه‌های NousResearch، شبکه Psyche است. این شبکه اثبات می‌کند که می‌توان مدل‌های بزرگ را بدون یک مرکز داده یکجا — با نودهایی در سراسر دنیا — آموزش داد. این مفهوم مستقیماً با یادگیری فدرال و حریم خصوصی در هوش مصنوعی مرتبط است.
اگر Psyche بتواند در مقیاس بزرگ‌تر ثابت کند، ممکن است مسیر توسعه مدل‌های بزرگ را برای همیشه تغییر دهد — از انحصار شرکت‌های بزرگ به یک مدل واقعاً توزیع‌شده.
همچنین روند رو به رشد ایجنت‌های خودمختار هوش مصنوعی نشان می‌دهد که Hermes Agent در مسیر درستی حرکت می‌کند.

جمع‌بندی

هرمس — هم در قالب مدل‌های زبانی و هم Hermes Agent — یک پروژه‌ای است که نشان می‌دهد متن‌باز بودن با قدرت تجاری لازم نیست در تناقض باشد.
Hermes 4 با بنچمارک‌های ریاضی که با مدل‌های اختصاصی گران‌قیمت رقابت می‌کند، و Hermes Agent با معماری حافظه سه‌لایه‌اش که واقعاً یاد می‌گیرد — این خانواده مدلی چیزی ارائه می‌دهد که جای دیگری پیدا نمی‌کنید: یک ایجنت هوش مصنوعی که هر روز که با آن کار می‌کنید، کارآمدتر می‌شود.
اگر توسعه‌دهنده هستید، محقق هستید، یا فقط می‌خواهید یک دستیار هوش مصنوعی داشته باشید که واقعاً حافظه داشته باشد — Hermes Agent ارزش امتحان کردن را دارد.
برای درک بهتر چشم‌انداز کلی هوش مصنوعی و مدل‌های زبانی بزرگ، می‌توانید مقاله مدل‌های زبانی هوش مصنوعی را در دیپ‌فا بخوانید.
✨ با دیپ‌فا، دنیای هوش مصنوعی در دستان شماست!! 🚀

جایی که نوآوری و هوش مصنوعی با هم ترکیب می‌شوند

دیپ‌فا همراه شماست تا با ابزارهای هوش مصنوعی فوق‌العاده، خلاقیت خود را به اوج برسانید و بهره‌وری را به سطحی جدید برسانید. اکنون وقت آن است که آینده را با هم بسازیم!

مدل‌های هوش مصنوعی
ChatGPT Claude Gemini DeepSeek Grok MiMo Perplexity DALL-E GPT-Image Nano Banana Midjourney Stable Diffusion Flux Sora Veo Runway Kling Luma ElevenLabs Suno
50+
ابزار هوش مصنوعی
9
دسته‌بندی خدمات
🎨
🎬
💬
✍️
🎹
📷
🎙️
📊
🔍
۵۰+ ابزار