هوش مصنوعی هرمس(Hermes): ایجنتی که یاد می‌گیرد، به خاطر می‌سپارد و هر روز بهتر می‌شود

تصور کنید هر بار که یک ابزار هوش مصنوعی باز می‌کنید، مجبور باشید از صفر توضیح بدهید که کی هستید، روی چه پروژه‌ای کار می‌کنید، چه فرمتی دوست دارید و چه اصطلاحاتی در کارتان رایج است. این دقیقاً مشکل اصلی اکثر ابزارهای هوش مصنوعی امروزی است؛ قابلیت‌های شگفت‌انگیز دارند، اما حافظه ندارند.

Hermes — ایجنت هوش مصنوعی متن‌باز ساخته‌شده توسط NousResearch — این مشکل را از ریشه حل کرده است. هرمس نه‌تنها به خاطر می‌سپارد، بلکه از تجربیات گذشته یاد می‌گیرد، مهارت‌های قابل‌استفاده مجدد می‌سازد و با هر بار استفاده، واقعاً بهتر می‌شود. این مقاله به بررسی عمیق هرمس — از مدل‌های زبانی آن تا Hermes Agent — می‌پردازد و نشان می‌دهد چرا این پروژه متن‌باز در حال تغییر قواعد بازی است.

NousResearch یک کلکتیو پژوهشی هوش مصنوعی است که چند سال است روی fine-tuning مدل‌های زبانی متن‌باز تمرکز دارد. آن‌ها سری مدل‌های Hermes را بر پایه معماری‌های Llama و Mistral توسعه داده‌اند و در میان توسعه‌دهندگانی که می‌خواهند مدل‌های قوی را روی سرور خودشان اجرا کنند — بدون اینکه داده‌هایشان به API‌های اختصاصی ارسال شود — محبوبیت زیادی کسب کرده‌اند.

نسل‌های هرمس یک مسیر تکاملی مشخص داشته‌اند:

این مسیر نشان‌دهنده یک چشم‌انداز مشخص است: مدلی که نه فقط جواب می‌دهد، بلکه واقعاً کار می‌کند.

Hermes 3 با fine-tuning روی Llama 3.1 ساخته شد و یکی از قابلیت‌های اصلی آن، پیروی دقیق از دستورالعمل‌های کاربر بود — نه دستورالعمل‌های یک شرکت. این تمایز مهم است: در حالی که مدل‌های تجاری مانند GPT-4o اغلب سوالاتی را به دلایل اخلاقی رد می‌کنند، Hermes 3 طراحی شده تا دقیقاً آنچه از آن خواسته می‌شود را انجام دهد — از نوشتن محتوای تخصصی تا function calling پیچیده و تولید JSON ساختاریافته.

قابلیت‌های کلیدی Hermes 3:

برای آشنایی بیشتر با RAG که یکی از مکانیزم‌های اصلی این مدل‌هاست، مقاله راهنمای جامع RAG در هوش مصنوعی را بخوانید.

Hermes 4 در اوت ۲۰۲۵ منتشر شد و یک قابلیت اساسی اضافه کرد: Hybrid Reasoning Mode. این یعنی مدل می‌تواند بین پاسخ سریع و تفکر گام‌به‌گام عمیق سوئیچ کند. وقتی یک مسئله پیچیده می‌دهید، با یک تگ <think> مدل وارد حالت تفکر می‌شود و مسیر استدلالش را قبل از پاسخ نهایی طی می‌کند — دقیقاً مانند یک انسان که قبل از جواب دادن فکر می‌کند.

نتایج بنچمارک Hermes 4 (نسخه 405B) حرف‌های بزرگی می‌زند:

برای مقایسه، GPT-4o در RefusalBench 17.67% و Claude Sonnet 4 نیز 17% گرفت. این یعنی Hermes 4 به مراتب کمتر از مدل‌های رقیب سوالات کاربران را رد می‌کند.

این مفهوم با مدل‌های استدلالی هوش مصنوعی که در deepfa.ir توضیح داده‌ایم، ارتباط مستقیم دارد.

Hermes 4.3 یک نقطه عطف تاریخی است: اولین مدل Hermes که با شبکه توزیع‌شده Psyche آموزش دیده. Psyche یک شبکه آموزشی غیرمتمرکز است که از بهینه‌ساز DisTrO استفاده می‌کند تا نودهای پردازشی پراکنده در سراسر جهان را — با امنیت blockchain سولانا — در یک فرآیند آموزشی واحد هماهنگ کند.

این نه‌تنها از نظر فنی جذاب است، بلکه یک پیام مهم دارد: آموزش مدل‌های بزرگ دیگر نیازی به مراکز داده غول‌پیکر ندارد.

بنچمارک‌های Hermes 4.3 (36B):

بنچمارک	Hermes 4.3 (36B)	توضیح
MATH-500	93.8%	مسائل ریاضی پیچیده
MMLU	87.7%	دانش عمومی چند حوزه‌ای
BBH (Big-Bench Hard)	86.4%	استدلال پیچیده
AIME 24	71.9%	المپیاد ریاضی دانشگاهی
GPQA Diamond	65.5%	سوالات تخصصی دکترا
RefusalBench	74.6%	نرخ پاسخ‌گویی (بالاتر = بهتر)

نکته جالب: Hermes 4.3 با ۳۶ میلیارد پارامتر در چندین بنچمارک از Hermes 4 با ۷۰ میلیارد پارامتر بهتر عمل می‌کند. این پنجره کانتکست ۵۱۲K توکن — که با مکانیسم توجه پیشرفته ممکن شده — یعنی می‌توانید کل یک کدبیس متوسط را در یک بار به مدل بدهید.

تفاوت بین یک چت‌بات و یک ایجنت را در یک مثال ساده ببینید:

Hermes Agent در فوریه ۲۰۲۶ توسط NousResearch منتشر شد و با بیش از ۳۲ هزار ستاره گیت‌هاب، به یکی از پرطرفدارترین پروژه‌های ایجنت متن‌باز تبدیل شده است.

قلب Hermes Agent یک سیستم حافظه منحصربه‌فرد است. برخلاف ابزارهایی که با هر سشن از صفر شروع می‌کنند، Hermes از سه لایه حافظه استفاده می‌کند:

۱. حافظه اپیزودیک (Episodic Memory)

ایجنت تجربیات گذشته خود را ذخیره می‌کند. اگر در یک وظیفه اشتباه کرد، این اشتباه در حافظه ثبت می‌شود و دفعه بعد رویکرد متفاوتی امتحان می‌کند. مثال واقعی: اگر روز اول در طبقه‌بندی ایشوهای گیت‌هاب منطق اشتباهی داشت، تا روز سوم خودش را اصلاح می‌کند.

۲. مدل کاربر (User Model)

فایل USER.md یک پروفایل دائمی از ترجیحات شما می‌سازد: زبان مورد نظر، فرمت خروجی دلخواه، اصطلاحات تخصصی‌تان، محدودیت‌هایی که دارید. این اطلاعات بین تمام session‌ها حفظ می‌شود.

۳. کتابخانه مهارت‌ها (Skill Library)

وقتی Hermes یک وظیفه پیچیده را انجام می‌دهد، رویکردش را به عنوان یک فایل Markdown مستند می‌کند. دفعه بعد که وظیفه مشابهی بدهید، به جای اینکه از صفر شروع کند، مهارت ذخیره‌شده را بارگذاری می‌کند. این یعنی سرعت بیشتر + هزینه کمتر.

این معماری ارتباط مستقیمی با مفهوم شبکه‌های عصبی تقویت شده با حافظه دارد که در سطح معماری هوش مصنوعی مطرح است.

Hermes Agent با ۴۰+ ابزار داخلی می‌آید که شامل می‌شود:

یکی از هوشمندانه‌ترین تصمیمات طراحی Hermes Agent، مستقل بودن آن از مدل است. می‌توانید با یک تغییر ساده در فایل .env بین GPT-5، Claude Opus 4.6، مدل‌های محلی Ollama و هر endpoint سازگار با OpenAI سوئیچ کنید — بدون اینکه هیچ چیز دیگری تغییر کند. مهارت‌ها، حافظه و مدل کاربر همه حفظ می‌شوند.

این انعطاف‌پذیری یعنی می‌توانید وظایف ارزان را به مدل‌های محلی و وظایف پیچیده را به مدل‌های frontier بسپارید — و هزینه را بهینه کنید.

برای آشنایی با مفهوم ایجنت‌های هوش مصنوعی، مطالعه مقاله ایجنت هوش مصنوعی می‌تواند پایه خوبی بسازد.

Hermes Agent از پروتکل MCP (Model Context Protocol) پشتیبانی می‌کند که ارتباط هوش مصنوعی با دنیای واقعی را ممکن می‌سازد. این یعنی Hermes می‌تواند مستقیماً با ابزارهای خارجی مانند Asana، Slack، GitHub و دیگر سرویس‌ها ارتباط برقرار کند.

Hermes به CLI، Telegram، Discord، Slack، WhatsApp، Signal و Email متصل می‌شود — همه با یک معماری مشترک. یعنی می‌توانید از طریق تلگرام یک task بدهید، Hermes آن را انجام دهد و نتیجه را همانجا برگرداند.

یک توسعه‌دهنده این گردش کار را راه‌اندازی کرده است:

این task یک بار تعریف می‌شود و با cron هر روز اجرا می‌شود. اگر اول در منطق طبقه‌بندی خطا کرد، حافظه اپیزودیک آن را ثبت می‌کند و تا روز سوم به خودی خود اصلاح می‌شود.

یک محقق از Hermes برای مرور ادبیات استفاده می‌کند:

یک کاربر گزارش کرده که به Hermes گفته: «یک اپلیکیشن مدیریت کارها (Todo) کامل با احراز هویت بساز و منتشر کن.» Hermes کد نوشته، تست‌ها را اجرا کرده، مشکلات را اشکال‌زدایی کرده و فرایند انتشار را انجام داده است — و مهارت‌های کسب‌شده در این فرایند را برای پروژه‌های مشابه بعدی ذخیره کرده است.

یک کاربر Hermes را روی Raspberry Pi 4 اجرا کرده و از آن به عنوان مغز مرکزی برای تمام دستگاه‌هایش استفاده می‌کند. ترجیحات کاربر در تمام دستگاه‌ها به اشتراک گذاشته می‌شود و Hermes کارها را با آگاهی از بافت کامل زندگی دیجیتال صاحبش انجام می‌دهد.

این نوع استفاده با مفهوم هوش مصنوعی لبه که پردازش را به لبه شبکه می‌برد، کاملاً همسو است.

ویژگی	Hermes Agent	LangChain/CrewAI	Claude Code / Cursor
حافظه پایدار بین session‌ها	✅ داخلی و سه‌لایه	⚠️ نیاز به پیاده‌سازی دستی	محدود
یادگیری خودکار از اشتباه	✅ loop یادگیری داخلی	❌ ندارد	❌ ندارد
مدل‌بودن آگنوستیک	✅ 200+ مدل	✅ بله	❌ محدود به مدل مشخص
نصب و راه‌اندازی	یک دستور curl	⚠️ پیکربندی پیچیده	✅ ساده
هزینه ماهانه	VPS $5 + هزینه API	متغیر	اشتراک ماهانه ثابت
پیام‌رسان‌های خارجی	✅ Telegram, Slack, Discord, ...	⚠️ نیاز به توسعه	❌ ندارد
متن‌باز بودن	✅ Apache 2.0	✅ بله	❌ اختصاصی

برای مقایسه دقیق‌تر فریمورک‌های ایجنت، مقاله مقایسه CrewAI، AutoGen و LangChain را بخوانید.

۱. هزینه بسیار پایین: Hermes Agent روی یک VPS $5 ماهانه اجرا می‌شود. برخلاف اشتراک‌های ماهانه ابزارهای تجاری، شما فقط هزینه API ای را می‌پردازید که واقعاً مصرف می‌کنید.

۲. کنترل کامل بر داده: چون به‌صورت self-hosted اجرا می‌شود، داده‌های شما — کدها، اسناد تجاری و پروژه‌ها — از زیرساخت و سرورهای خودتان خارج نمی‌شوند.

۳. قابلیت اجرا با مدل‌های محلی: با Ollama می‌توانید Hermes 4.3 را کاملاً آفلاین روی یک سیستم با GPU مناسب اجرا کنید — بدون نیاز به هیچ API خارجی.

۴. بدون سانسور بیش از حد: یکی از شکایات رایج از مدل‌های تجاری این است که بسیاری از سوالات کاملاً قانونی و مرتبط با کار را رد می‌کنند. Hermes طراحی شده تا ابتدا به کاربر پاسخ دهد.

صادقانه بگوییم: Hermes Agent هنوز در مراحل اولیه است.

یکی از جذاب‌ترین جنبه‌های NousResearch، شبکه Psyche است. این شبکه اثبات می‌کند که می‌توان مدل‌های بزرگ را بدون یک مرکز داده یکجا — با نودهایی در سراسر دنیا — آموزش داد. این مفهوم مستقیماً با یادگیری فدرال و حریم خصوصی در هوش مصنوعی مرتبط است.

اگر Psyche بتواند در مقیاس بزرگ‌تر ثابت کند، ممکن است مسیر توسعه مدل‌های بزرگ را برای همیشه تغییر دهد — از انحصار شرکت‌های بزرگ به یک مدل واقعاً توزیع‌شده.

همچنین روند رو به رشد ایجنت‌های خودمختار هوش مصنوعی نشان می‌دهد که Hermes Agent در مسیر درستی حرکت می‌کند.

هرمس — هم در قالب مدل‌های زبانی و هم Hermes Agent — یک پروژه‌ای است که نشان می‌دهد متن‌باز بودن با قدرت تجاری لازم نیست در تناقض باشد.

Hermes 4 با بنچمارک‌های ریاضی که با مدل‌های اختصاصی گران‌قیمت رقابت می‌کند، و Hermes Agent با معماری حافظه سه‌لایه‌اش که واقعاً یاد می‌گیرد — این خانواده مدلی چیزی ارائه می‌دهد که جای دیگری پیدا نمی‌کنید: یک ایجنت هوش مصنوعی که هر روز که با آن کار می‌کنید، کارآمدتر می‌شود.

اگر توسعه‌دهنده هستید، محقق هستید، یا فقط می‌خواهید یک دستیار هوش مصنوعی داشته باشید که واقعاً حافظه داشته باشد — Hermes Agent ارزش امتحان کردن را دارد.

برای درک بهتر چشم‌انداز کلی هوش مصنوعی و مدل‌های زبانی بزرگ، می‌توانید مقاله مدل‌های زبانی هوش مصنوعی را در دیپ‌فا بخوانید.

هوش مصنوعی هرمس(Hermes): ایجنتی که یاد می‌گیرد، به خاطر می‌سپارد و هر روز بهتر می‌شود

مقدمه

NousResearch کیست و هرمس از کجا آمد؟

مدل‌های زبانی هرمس: از Hermes 3 تا Hermes 4.3

Hermes 3؛ پایه‌ای که هنوز مرتبط است

Hermes 4؛ وقتی استدلال هیبریدی وارد بازی می‌شود

Hermes 4.3؛ نخستین مدل آموزش‌دیده روی شبکه توزیع‌شده

Hermes Agent؛ وقتی مدل تبدیل به یک دستیار واقعی می‌شود

معماری حافظه سه‌لایه

قابلیت‌های Hermes Agent که واقعاً متفاوت است

بیش از ۴۰ ابزار داخلی

سازگاری با همه مدل‌های بزرگ

پشتیبانی از MCP

یکپارچگی با پیام‌رسان‌ها

مثال‌های واقعی: Hermes Agent در عمل

مثال ۱: اتوماسیون روزانه توسعه‌دهنده

مثال ۲: مرور ادبیات پژوهشی

مثال ۳: ساخت پروژه کامل نرم‌افزاری

مثال ۴: دستیار شخصی روی Raspberry Pi

مقایسه Hermes با رقبا

چرا Hermes برای توسعه‌دهندگان ایرانی جذاب است؟

محدودیت‌هایی که باید بدانید

چشم‌انداز آینده: Psyche و آموزش غیرمتمرکز

جمع‌بندی

جایی که نوآوری و هوش مصنوعی با هم ترکیب می‌شوند

هوش مصنوعی هرمس(Hermes): ایجنتی که یاد می‌گیرد، به خاطر می‌سپارد و هر روز بهتر می‌شود

مقدمه

NousResearch کیست و هرمس از کجا آمد؟

مدل‌های زبانی هرمس: از Hermes 3 تا Hermes 4.3

Hermes 3؛ پایه‌ای که هنوز مرتبط است

Hermes 4؛ وقتی استدلال هیبریدی وارد بازی می‌شود

Hermes 4.3؛ نخستین مدل آموزش‌دیده روی شبکه توزیع‌شده

Hermes Agent؛ وقتی مدل تبدیل به یک دستیار واقعی می‌شود

معماری حافظه سه‌لایه

قابلیت‌های Hermes Agent که واقعاً متفاوت است

بیش از ۴۰ ابزار داخلی

سازگاری با همه مدل‌های بزرگ

پشتیبانی از MCP

یکپارچگی با پیام‌رسان‌ها

مثال‌های واقعی: Hermes Agent در عمل

مثال ۱: اتوماسیون روزانه توسعه‌دهنده

مثال ۲: مرور ادبیات پژوهشی

مثال ۳: ساخت پروژه کامل نرم‌افزاری

مثال ۴: دستیار شخصی روی Raspberry Pi

مقایسه Hermes با رقبا

چرا Hermes برای توسعه‌دهندگان ایرانی جذاب است؟

محدودیت‌هایی که باید بدانید

چشم‌انداز آینده: Psyche و آموزش غیرمتمرکز

جمع‌بندی

جایی که نوآوری و هوش مصنوعی با هم ترکیب می‌شوند

مقالات مرتبط

Claude Sonnet 5: هوش مصنوعی که مرز چت‌بات و ایجنت مستقل را پشت سر گذاشت

Mythos و Fable؛ دو مدل هوش مصنوعی که از Claude Opus هم قدرتمندتر شدند

OpenClaw: هوش مصنوعی که به‌جای حرف زدن، کار می‌کند

MCP در سازمان‌ها: چطور شرکت‌ها هوش مصنوعی را به سیستم‌های داخلی‌شان وصل می‌کنند

تاریک‌ترین جنبه‌های هوش مصنوعی: وقتی MCP دسترسی به همه چیز را می‌دهد

MCP، LangChain، CrewAI یا AutoGen؟ هوش مصنوعی با کدام ابزار واقعاً کار می‌کند