في هذه المقابلة، نلتقي مع آشتون، وهو مهندس مؤسس في ثيتا، لمناقشة أحدث تطورات البنية التحتية للتعلم المعزز. يقوم بتفصيلفي هذه المقابلة، نلتقي مع آشتون، وهو مهندس مؤسس في ثيتا، لمناقشة أحدث تطورات البنية التحتية للتعلم المعزز. يقوم بتفصيل

تعرف على الكاتب: أشتون تشيو، المهندس المؤسس في ثيتا

2025/12/15 04:25


لنبدأ! أخبرنا قليلاً عن نفسك. على سبيل المثال، الاسم، المهنة، والاهتمامات الشخصية.

مرحباً! اسمي آشتون، وأنا مهندس مؤسس في شركة ثيتا حيث أعمل على بنية التعلم المعزز، والتعلم المعزز، والأنظمة الموزعة. أركز بشكل خاص على استخدام الكمبيوتر واستخدام الأدوات. في الماضي، عملت في Amazon AGI وتعاملت مع بنية الاستدلال واستخدام الأدوات. في وقت فراغي، أحب التصميم الجرافيكي، والمشاريع الجانبية، وتسلق الصخور.

مثير للاهتمام! ما هو آخر موضوع رئيسي لك في Hackernoon؟

قصتي الأخيرة، "هل يمكن للذكاء الاصطناعي الخاص بك استخدام الكمبيوتر فعلياً؟ خريطة 2025 لمعايير استخدام الكمبيوتر"، تناولت واحدة من أكثر المجالات سخونة في رأس المال الاستثماري حالياً: بيئات التعلم المعزز والتقييمات. قدمت نظرة شاملة عن أكثر معايير استخدام الكمبيوتر استخداماً، بالإضافة إلى نصائح عملية حول كيفية اختيار المعايير لتدريب واختبار وكلاء استخدام الكمبيوتر.

كنت أواجه نفس الفجوة باستمرار: لا توجد العديد من المقالات التي تراجع المعايير نفسها. ومع نمو هذا المجال، من الضروري أن نقيّم الجودة فعلياً بدلاً من مكافأة أي شيء يحدث للتلاعب بالمقياس. لقد مررنا بهذا من قبل. في الأيام الأولى من نماذج اللغة الكبيرة، كانت المعايير عشوائية ومتباينة بما يكفي لتعكس الفائز الحقيقي بشكل ضعيف فقط.

أصبحت المعايير بمثابة لوحة النتائج الفعلية لـ "أفضل نموذج"، ثم أدرك الناس أن الكثير منها لم يكن يقيس ما ادعوه.

كان أحد أكثر إخفاقات العصر المبكر كشفاً عندما تحول "فهم القراءة" بهدوء إلى "مطابقة النمط على هيكل مجموعة البيانات". أجرى الباحثون خطوط أساس استفزازية متعمدة (سؤال فقط، الجملة الأخيرة فقط)، وكانت النتائج مرتفعة بما يكفي لإثارة احتمال غير مريح: لم يجبر المعيار النماذج باستمرار على استخدام المقطع الكامل. في نقد عام 2018، لم تكن النقطة أن القراءة لا تهم أبداً، ولكن أن بعض مجموعات البيانات جعلتها اختيارية عن طريق الخطأ من خلال المكافأة المفرطة للاختصارات مثل الحداثة والإجابات النمطية المسبقة.

\

# المهمة المفترضة: الإجابة على السؤال بناءً على المقطع والسؤال المقطع (ملخص): - الجمل 1-8: يوم جون في المدرسة (تفاصيل غير ذات صلة في الغالب) - الجملة 9: "بعد المدرسة، ذهب جون إلى المطبخ." - الجملة 10: "أكل شريحة من البيتزا قبل أن يبدأ واجبه المنزلي." السؤال: "ماذا أكل جون؟" الإجابة: "بيتزا"

يكافئ المعيار عن طريق الخطأ اختصاراً حيث يعطي النموذج وزناً زائداً للجملة الأخيرة (لأن الإجابة غالباً ما تكون قرب النهاية) ويستخرج ببساطة المفعول به المباشر للإجراء الأخير ("أكل ___")، والذي في هذه الحالة ينتج "بيتزا".

ثم يأتي خط الأساس الأكثر ضرراً: إزالة المقطع بالكامل ومعرفة ما يحدث. إذا كان نموذج السؤال فقط تنافسياً، فهذه علامة على أن مجموعة البيانات تسرب إشارة من خلال التكرار والمعلومات المسبقة بدلاً من اختبار الفهم المستند إلى المقطع.

السؤال: "ماذا أكل جون؟"

خط الأساس هذا هو في الأساس فحص للعقل: هل يمكن للنموذج أن يسجل جيداً بالاعتماد على قوالب الإجابة عالية التردد دون الاستناد إلى المقطع على الإطلاق؟ في الممارسة العملية، فإنه يخمن رمزاً تكافئه مجموعة البيانات بشكل غير متناسب ("بيتزا"، "ساندويتش")، وإذا نجح ذلك أكثر مما ينبغي، فأنت لا تقيس الفهم بقدر ما تقيس المعلومات المسبقة لمجموعة البيانات.

لقد أنتجت تقييمات استخدام الكمبيوتر بالفعل اختصاراً أكثر حرفية: لدى الوكيل متصفح، والمعيار عام، ويتحول التقييم إلى امتحان مفتوح الكتاب مع مفتاح الإجابة في الصفحة الأخيرة. في ورقة لوحة صدارة الوكيل الشامل (HAL)، يفيد المؤلفون بملاحظة وكلاء بحثوا عن المعيار على HuggingFace بدلاً من حل المهمة، وهو سلوك لا تلتقطه إلا إذا فحصت السجلات.

\

# المهمة المفترضة: إكمال سير العمل داخل بيئة الويب المهمة: "تكوين الإعداد X في التطبيق والتحقق من تمكينه." وضع الفشل: 1) فتح علامة تبويب جديدة 2) البحث عن: "حالة التمكين المتوقعة للمعيار X" / "HAL <معيار> الإعداد X" 3) العثور على: المستودع / كتابة لوحة الصدارة / بطاقة مجموعة البيانات / سلسلة المشكلة 4) إعادة إنتاج حالة النهاية المتوقعة (الإجابة)

في تلك النقطة، كان التقييم يقيس ما إذا كان بإمكانه تحديد موقع مفتاح الإجابة.

المهمة: "ابحث عن الصفحة الصحيحة واستخرج Y." وضع الفشل: - البحث: "<اسم المعيار> Y" - النسخ من عنصر عام (مستندات، منشور منتدى، بطاقة مجموعة بيانات) - لصق القيمة في إخراج الوكيل كما لو كانت قادمة من التفاعل

إذا كان بإمكان الوكيل سحب القيمة من بطاقة مجموعة بيانات أو مستودع و"النجاح" مع ذلك، فإن فحص النجاح يقيّم المعقولية، وليس صحة التفاعل. المهام العامة بالإضافة إلى التحقق السطحي تحول البحث على الويب إلى استغلال.

هذان المثالان هما طلقة تحذير: إذا لم نحتفظ بمعايير استخدام الكمبيوتر بمعايير أعلى في وقت مبكر، فسنكرر عصر نماذج اللغة الكبيرة فقط مع واجهات مستخدم أفضل وطرق أكثر تفصيلاً للغش.

هل تكتب عادة عن مواضيع مماثلة؟ إذا لم يكن كذلك، عن ماذا تكتب عادة؟

نعم! أثناء العمل على بيئات التعلم المعزز والبنية التحتية للتعلم المعزز حول استخدام الكمبيوتر، أنا محاط باستمرار بأفضل نماذج استخدام الكمبيوتر وأكثر بيئات التدريب واقعية. لذلك كتبت مقالاً آخر، "الشاشة هي واجهة برمجة التطبيقات"، وهو حالة لاستخدام الكمبيوتر ولماذا هو مستقبل نماذج الذكاء الاصطناعي.

هذا المجال غير مبلغ عنه بشكل كبير لسببين:

  1. النماذج ليست قادرة في استخدام الكمبيوتر كما هي في المهام الأخرى (البرمجة، الرياضيات، إلخ).
  2. استخدام الكمبيوتر سريع الحركة وجديد للغاية.

أريد تغيير ذلك.

رائع! كيف هو روتين الكتابة المعتاد لديك (إذا كان لديك واحد)

عادة ما أقرأ مجموعة من الأوراق البحثية وأتحدث مع زملائي في الصناعة حول أفكارهم حول موضوع ما. بخلاف ذلك، أقضي الكثير من الوقت في قراءة المقالات التي كتبها مدونون رائعون مثل PG. لذلك عادة ما أستلهم الكثير من الإلهام من أشخاص آخرين في كتاباتي.

كونك كاتباً في مجال التكنولوجيا يمكن أن يكون تحدياً. غالباً ما لا يكون دورنا الرئيسي، بل إضافة إلى دور آخر. ما هو أكبر تحد تواجهه عندما يتعلق الأمر بالكتابة؟

إيجاد الوقت للجلوس ووضع تجربتي المعاشة في كلمات.

ما هو الشيء التالي الذي تأمل في تحقيقه في حياتك المهنية؟

معالجة مشاكل أصعب مع أشخاص رائعين، والتعلم من هؤلاء الأشخاص، ومشاركة تجاربي.

واو، هذا رائع. الآن، شيء أكثر عفوية: ما هي متعتك المذنبة المفضلة؟

مشاهدة الأفلام! فيلمي المفضل حالياً هو Catch Me If You Can (2002).

هل لديك هواية غير متعلقة بالتكنولوجيا؟ إذا كان الأمر كذلك، ما هي؟

أحب تسلق الصخور لأنه يجعلني أشعر وكأنني وكيل استخدام كمبيوتر بشري يتفاعل مع جدار التسلق. أنا أمزح. أعتقد أن تسلق الصخور ممتع للغاية لأنه يسمح لي بإبعاد ذهني عن العمل وتوحيد تفكيري.

ماذا يمكن لمجتمع Hacker Noon أن يتوقع قراءته منك في المرة القادمة؟

أنا أكتب حالياً قطعة أخرى عن البنية التحتية لبيئة التعلم المعزز!

ما رأيك في HackerNoon كمنصة للكتاب؟

أعتقد أن هيكل المراجعة رائع، وكان مكاناً رائعاً لي لوضع أفكاري أمام القراء التقنيين.

شكراً لك على أخذ الوقت للانضمام إلى سلسلة "تعرف على الكاتب" الخاصة بنا. كان من دواعي سروري. هل لديك أي كلمات ختامية؟

أنا أحب الكتابة. شكراً لك، HackerNoon!

فرصة السوق
شعار CATCH
CATCH السعر(CATCH)
$0.00196
$0.00196$0.00196
-16.23%
USD
مخطط أسعار CATCH (CATCH) المباشر
إخلاء مسؤولية: المقالات المُعاد نشرها على هذا الموقع مستقاة من منصات عامة، وهي مُقدمة لأغراض إعلامية فقط. لا تُظهِر بالضرورة آراء MEXC. جميع الحقوق محفوظة لمؤلفيها الأصليين. إذا كنت تعتقد أن أي محتوى ينتهك حقوق جهات خارجية، يُرجى التواصل عبر البريد الإلكتروني service@support.mexc.com لإزالته. لا تقدم MEXC أي ضمانات بشأن دقة المحتوى أو اكتماله أو حداثته، وليست مسؤولة عن أي إجراءات تُتخذ بناءً على المعلومات المُقدمة. لا يُمثل المحتوى نصيحة مالية أو قانونية أو مهنية أخرى، ولا يُعتبر توصية أو تأييدًا من MEXC.

قد يعجبك أيضاً

ميتابلانيت تشكل شركات تابعة تركز على البيتكوين في اليابان والولايات المتحدة

ميتابلانيت تشكل شركات تابعة تركز على البيتكوين في اليابان والولايات المتحدة

ظهر المنشور "ميتابلانيت تشكل الشركات التابعة المتخصصة في بيتكوين في اليابان والولايات المتحدة" على BitcoinEthereumNews.com. قالت ميتابلانيت (3350)، أكبر شركة خزينة بيتكوين في اليابان، إنها أسست شركتين تابعتين - واحدة في اليابان وأخرى في الولايات المتحدة - واشترت اسم النطاق bitcoin.jp لتعزيز التزامها بأكبر عملة مشفرة. ستكون شركة Bitcoin Japan Inc. مقرها في طوكيو وستدير مجموعة من وسائل الإعلام والمؤتمرات والمنصات عبر الإنترنت المرتبطة ببيتكوين، بما في ذلك نطاق الإنترنت ومجلة بيتكوين اليابان. أما الوحدة الأمريكية، Metaplanet Income Corp.، فستكون مقرها في ميامي وستركز على توليد الدخل من المنتجات المالية المرتبطة ببيتكوين، بما في ذلك المشتقات، كما قالت الشركة في منشور على X. وأشارت ميتابلانيت إلى أنها أطلقت أعمال توليد دخل بيتكوين في الربع الأخير من عام 2024 وتهدف إلى توسيع نطاق هذه العمليات من خلال الشركة التابعة الجديدة. يقود الشركتين التابعتين المملوكتين بالكامل جزئياً الرئيس التنفيذي لميتابلانيت سيمون جيروفيتش. في وقت سابق من هذا الشهر، رفعت الشركة حيازاتها من بيتكوين إلى أكثر من 20,000 BTC. وهي حالياً سادس أكبر شركة خزينة بيتكوين في العالم، مع 20,136 BTC في ميزانيتها العمومية، وفقاً لبيانات BitcoinTreasuries. الشركة الرائدة، Strategy (MSTR)، لديها 638,985 BTC. تم تأسيس الشركات التابعة بعد وقت قصير من إعلان الشركة عن خطط لجمع صافي 204.1 مليار ين (1.4 مليار دولار) في بيع أسهم دولي لتعزيز حيازاتها من BTC. انخفض سهم ميتابلانيت بنسبة 1.16% يوم الأربعاء. المصدر: https://www.coindesk.com/business/2025/09/17/metaplanet-sets-up-u-s-japan-subsidiaries-buys-bitcoin-jp-domain-name
مشاركة
BitcoinEthereumNews2025/09/18 06:12
كسر الصمت: ديفيد هيرمان عن فك شفرة المقاومة وقيادة التغيير

كسر الصمت: ديفيد هيرمان عن فك شفرة المقاومة وقيادة التغيير

يعتقد معظم قادة الأعمال أنهم يحلون مشاكل الاستراتيجية، أو عدم كفاءة العمليات، أو فجوات التنفيذ. ولكن وفقًا لديفيد هيرمان، الرئيس التنفيذي ومؤلف
مشاركة
Techbullion2025/12/16 04:37
انخفاض البيتكوين إلى ما دون 87 ألف دولار بعد شراء الاستراتيجية 10,645 BTC

انخفاض البيتكوين إلى ما دون 87 ألف دولار بعد شراء الاستراتيجية 10,645 BTC

ظهر المنشور "انخفاض البيتكوين إلى ما دون 87 ألف دولار بعد شراء الاستراتيجية 10,645 BTC" على BitcoinEthereumNews.com. أبرز النقاط في 15 ديسمبر، انخفض البيتكوين بنسبة 2.71%، متراجعاً
مشاركة
BitcoinEthereumNews2025/12/16 04:02