Tag: OpenAI

  • OpenAI announces an API for ChatGPT and its Whisper speech-to-text tech

    اوپن اے آئی نے اعلان کیا ہے۔ کہ اب یہ تیسرے فریق کے ڈویلپرز کو ایک API کے ذریعے ChatGPT کو اپنی ایپس اور سروسز میں ضم کرنے کی اجازت دے رہا ہے اور ایسا کرنا اس کے موجودہ لینگویج ماڈلز کے استعمال سے کافی سستا ہوگا۔ کمپنی وسپر بنا رہی ہے، اس کا AI سے چلنے والا اسپیچ ٹو ٹیکسٹ ماڈل، ایک API کے ذریعے استعمال کے لیے دستیاب ہے اور اس کے ڈویلپر کی سروس کی شرائط میں کچھ اہم تبدیلیاں کر رہا ہے۔

    اوپن اے آئی کا کہنا ہے کہ اس کا چیٹ جی پی ٹی API صرف ایک AI سے چلنے والا چیٹ انٹرفیس بنانے سے زیادہ کے لیے استعمال کیا جا سکتا ہے – حالانکہ یہ کئی کمپنیوں کو بھی نمایاں کرتا ہے جو اس مقصد کے لیے اسے استعمال کر رہی ہیں، بشمول سنیپ کی مائی اے آئی فیچرجس کا اعلان اس ہفتے کے شروع میں کیا گیا تھا۔ کمپنی کا کہنا ہے کہ اس کی نئی ماڈل فیملی، جسے gpt-3.5-turbo کہا جاتا ہے، \”بہت سے غیر چیٹ استعمال کے معاملات کے لیے بہترین ماڈل ہے۔\”

    یہ بات قابل غور ہے کہ ماڈل ممکنہ طور پر وہی نہیں ہے جو Bing استعمال کر رہا ہے، جسے مائیکروسافٹ نے \”نیا، اگلی نسل کا OpenAI بڑے لینگویج ماڈل\” کہا ہے جو ChatGPT اور GPT- کے مقابلے میں \”اور بھی تیز، زیادہ درست اور زیادہ قابل\” ہے۔ 3.5 تاہم، یہ دیکھتے ہوئے کہ کمپنی نے OpenAI میں کتنی رقم کی سرمایہ کاری کی ہے، یہ کوئی تعجب کی بات نہیں ہے کہ اسے ٹیک تک رسائی حاصل ہے جو اوسط ڈویلپر کے لیے دستیاب نہیں ہے۔ مائیکروسافٹ بھی ہے اپنی ٹیک کی صحت مند خوراک کا استعمال کرتے ہوئے Bing کے لیے

    OpenAI $0.002 میں 1,000 ٹوکن پیش کر رہا ہے اور اس کا کہنا ہے کہ یہ \”ہمارے موجودہ GPT-3.5 ماڈلز سے 10 گنا سستا ہے،\” جزوی طور پر \”سسٹم کی وسیع اصلاح کی ایک سیریز\” کا شکریہ۔ اگرچہ 1,000 بہت زیادہ لگتا ہے، یہ بات قابل غور ہے کہ API کو جواب دینے کے لیے متن کا ایک ٹکڑا بھیجنے میں کئی ٹوکن لاگت آسکتی ہے۔ (\”ٹوکنز\” ٹیکسٹ کے وہ بلاکس ہیں جن میں سسٹم جملے اور الفاظ کو توڑ دیتا ہے تاکہ یہ اندازہ لگایا جا سکے کہ اس کے بعد کون سا متن نکلنا چاہیے۔)

    کے مطابق اوپن اے آئی کی دستاویزات, \”ChatGPT بہت اچھا ہے!\” چھ ٹوکن لیتا ہے – اس کا API اسے \”چیٹ،\” \”جی،\” \”PT،\” \”اس،\” \”زبردست، اور \”!\” میں تقسیم کرتا ہے۔ کمپنی ایک آلہ فراہم کرتا ہے یہ جانچنے کے لیے کہ متن کی ایک تار کی ترجمانی کرنے کے لیے کتنے ٹوکن درکار ہوں گے اور یہ کہتا ہے کہ انگوٹھے کا ایک عمومی اصول یہ ہے کہ انگریزی میں \”ایک ٹوکن عام طور پر ~4 حروف کے مساوی ہوتا ہے\”۔

    کمپنی کا کہنا ہے کہ ڈویلپرز بھی ChatGPT کی ایک سرشار مثال حاصل کرنے کے قابل ہوں گے اگر وہ API کے ذریعے ڈیٹا کی ایک بڑی مقدار چلا رہے ہیں۔ اس کی پوسٹ میں کہا گیا ہے کہ ایسا کرنے سے آپ کو اس بات پر زیادہ کنٹرول ملے گا کہ آپ کون سا ماڈل استعمال کر رہے ہیں، آپ درخواستوں کا جواب دینے میں کتنا وقت لگانا چاہتے ہیں، اور بوٹ کے ساتھ کتنی دیر تک بات چیت ہو سکتی ہے۔

    جبکہ ChatGPT سب سے زیادہ توجہ حاصل کرنے کا امکان ہے، OpenAI نے Whisper کے لیے ایک اور نئے API کا بھی اعلان کیا ہے، اس کا اسپیچ ٹو ٹیکسٹ ماڈل۔ کمپنی کا کہنا ہے کہ آپ اسے $0.006 فی منٹ کی لاگت سے آڈیو کو نقل کرنے یا ترجمہ کرنے کے لیے استعمال کر سکتے ہیں۔ تکنیکی طور پر، وسپر ماڈل اوپن سورس ہے، لہذا آپ کر سکتے ہیں۔ اسے اپنے ہارڈ ویئر پر بغیر کچھ ادا کیے چلائیں۔. تاہم، اوپن اے آئی کو ممکنہ طور پر زیادہ طاقتور ہارڈ ویئر تک رسائی حاصل ہے، لہذا اگر آپ فوری تبدیلی کی تلاش کر رہے ہیں یا فون جیسے کم طاقت والے آلات پر ٹرانسکرپشن کرنے کی ضرورت ہے، تو API کا استعمال کرنے کا راستہ ہوسکتا ہے۔

    OpenAI کچھ پالیسی تبدیلیوں کا بھی اعلان کر رہا ہے جو اس کے بقول ڈویلپر کے تاثرات پر مبنی ہیں۔ ایک بڑا یہ کہہ رہا ہے کہ وہ اپنے ماڈلز کو تربیت دینے کے لیے API کے ذریعے جمع کرائے گئے ڈیٹا کو مزید استعمال نہیں کرے گا جب تک کہ صارفین واضح طور پر اس استعمال کو ٹھیک نہ کریں۔

    دوسرے لفظوں میں، یہ آپٹ آؤٹ سسٹم سے آپٹ ان کی طرف جا رہا ہے۔ یہ تبدیلی بوٹ میں ملکیتی معلومات ڈالنے کے بارے میں کچھ خدشات کو دور کرنے میں مدد کر سکتی ہے، کیونکہ کچھ کمپنیوں نے ملازمین کو ٹیک کو مکمل طور پر استعمال کرنے سے روک دیا ہے۔ اگر یہ صارف کے ان پٹ سے سیکھ رہا ہے، تو تجارتی رازوں کو داخل کرنا برا خیال ہوگا، کیوں کہ اس بات کا ہمیشہ امکان رہتا ہے کہ وہ اس ڈیٹا کو واپس کسی اور کو بھیج سکتا ہے۔

    کمپنی کا یہ بھی کہنا ہے کہ وہ اپنے اپ ٹائم کو بہتر بنانے پر کام کر رہی ہے اور یہ کہ اس کی \”انجینئرنگ ٹیم کی اولین ترجیح اب پیداوار کے استعمال کے معاملات کا استحکام ہے۔\”

    جب کہ کئی ڈویلپرز نے اپنی ایپس میں چیٹ سروسز کو شامل کرنے کے لیے حل نکالے ہیں – بشمول OpenAI کے ریگولر GPT API کا استعمال کرتے ہوئے، جو کچھ عرصے سے دستیاب ہے – ایک آفیشل ChatGPT API کا تعارف ایسا محسوس ہوتا ہے کہ یہ فلڈ گیٹس کے کھلنے کا لمحہ ہوسکتا ہے۔ جبکہ کمپنیاں کافی ہیں۔ اپنے AI چیٹ بوٹ ماڈلز پر کام کر رہے ہیں۔، اس طرح کی چیز زیادہ تر ڈویلپرز کی پہنچ سے باہر ہے۔ اب، وہ صرف OpenAI کی ٹیک استعمال کر سکیں گے۔



    >Source link>

    >>Join our Facebook page From top right corner. <<

  • OpenAI launches an API for ChatGPT, plus dedicated capacity for enterprise customers

    فون کرنے کے لئے چیٹ جی پی ٹیسان فرانسسکو میں قائم سٹارٹ اپ OpenAI کی طرف سے تیار کردہ مفت ٹیکسٹ جنریٹنگ AI، ایک ہٹ ایک بہت بڑی کمی ہے۔

    دسمبر تک، ChatGPT کے پاس ایک تھا۔ اندازہ لگایا گیا 100 ملین سے زیادہ ماہانہ فعال صارفین۔ یہ ہے متوجہ میڈیا کی بڑی توجہ اور سوشل میڈیا پر ان گنت میمز کو جنم دیا۔ اس کی عادت ہو گئی ہے۔ لکھنا ایمیزون کے کنڈل اسٹور میں سیکڑوں ای بکس۔ اور اس کا سہرا کم از کم coauthoring کا ہے۔ ایک سائنسی کاغذ.

    لیکن اوپن اے آئی، ایک کاروبار ہونے کے ناطے – اگرچہ ایک محدود منافع والا – کسی نہ کسی طرح ChatGPT کو منیٹائز کرنا پڑا، ایسا نہ ہو کہ سرمایہ کار پریشان ہو جائیں۔ اس نے ایک پریمیم سروس کے آغاز کے ساتھ اس کی طرف ایک قدم اٹھایا، چیٹ جی پی ٹی پلس، فروری میں. اور اس نے آج ایک بڑا اقدام کیا، ایک API متعارف کرایا جو کسی بھی کاروبار کو اپنی ایپس، ویب سائٹس، مصنوعات اور خدمات میں ChatGPT ٹیک بنانے کی اجازت دے گا۔

    ایک API ہمیشہ منصوبہ تھا۔ یہ OpenAI کے صدر اور چیئرمین (اور شریک بانیوں میں سے ایک) گریگ بروک مین کے مطابق ہے۔ اس نے کل سہ پہر ChatGPT API کے آغاز سے پہلے ایک ویڈیو کال کے ذریعے مجھ سے بات کی۔

    بروک مین نے کہا کہ \”ان APIs کو ایک خاص معیار کی سطح تک پہنچانے میں ہمیں کچھ وقت لگتا ہے۔\” \”میرے خیال میں یہ اس قسم کی ہے، جیسے، صرف مانگ اور پیمانے کو پورا کرنے کے قابل ہونا۔\”

    بروک مین کا کہنا ہے کہ ChatGPT API اسی AI ماڈل سے چلتا ہے جو OpenAI کے بے حد مقبول ChatGPT کے پیچھے ہے، جسے \”gpt-3.5-turbo\” کہا جاتا ہے۔ GPT-3.5 سب سے طاقتور ٹیکسٹ تیار کرنے والا ماڈل ہے جو OpenAI آج اپنے API سوٹ کے ذریعے پیش کرتا ہے۔ \”ٹربو\” مانیکر سے مراد ہے۔ مرضی کے مطابق، زیادہ ذمہ دار GPT-3.5 کا ورژن جسے OpenAI خاموشی سے ChatGPT کی جانچ کر رہا ہے۔

    $0.002 فی 1,000 ٹوکنز، یا تقریباً 750 الفاظ کی قیمت پر، بروک مین کا دعویٰ ہے کہ API \”نان چیٹ\” ایپلی کیشنز سمیت متعدد تجربات چلا سکتا ہے۔ Snap، Quizlet، Instacart اور Shopify ابتدائی اپنانے والوں میں شامل ہیں۔

    gpt-3.5-turbo تیار کرنے کے پیچھے ابتدائی محرک ChatGPT کے بہت بڑے کمپیوٹ اخراجات کو کم کرنا ہو سکتا ہے۔ اوپن اے آئی کے سی ای او سیم آلٹ مین نے ایک بار چیٹ جی پی ٹی کے اخراجات کو \”آنکھوں میں پانی ڈالنے والا\” کہا تھا۔ ان کا اندازہ لگانا کمپیوٹ کے اخراجات میں چند سینٹ فی چیٹ پر۔ (ایک ملین سے زیادہ صارفین کے ساتھ، اس میں ممکنہ طور پر تیزی سے اضافہ ہوتا ہے۔)

    لیکن بروک مین کا کہنا ہے کہ gpt-3.5-turbo کو دوسرے طریقوں سے بہتر بنایا گیا ہے۔

    \”اگر آپ AI سے چلنے والا ٹیوٹر بنا رہے ہیں، تو آپ کبھی نہیں چاہیں گے کہ ٹیوٹر صرف طالب علم کو جواب دے۔ آپ چاہتے ہیں کہ یہ ہمیشہ اس کی وضاحت کرے اور سیکھنے میں ان کی مدد کرے — یہ اس قسم کے نظام کی ایک مثال ہے جسے آپ بنانے کے قابل ہونا چاہیے۔ [with the API]\”بروک مین نے کہا۔ \”ہم سوچتے ہیں کہ یہ کچھ ایسا ہونے جا رہا ہے جو صرف، جیسے، API کو بہت زیادہ قابل استعمال اور قابل رسائی بنائے گا۔\”

    ChatGPT API انڈر پن کرتا ہے۔ میرا AI، Snap کی Snapchat+ سبسکرائبرز کے لیے حال ہی میں اعلان کردہ چیٹ بوٹ، اور Quizlet کی نئی Q-Chat ورچوئل ٹیوٹر کی خصوصیت۔ Shopify نے خریداری کی سفارشات کے لیے ذاتی نوعیت کا اسسٹنٹ بنانے کے لیے ChatGPT API کا استعمال کیا، جب کہ Instacart نے Ask Instacart بنانے کے لیے اس کا فائدہ اٹھایا، جو ایک آنے والا ٹول ہے جو Instacart کے صارفین کو کھانے کے بارے میں پوچھنے اور کمپنی کے ریٹیل سے پروڈکٹ ڈیٹا کے ذریعے مطلع \”شاپ کے قابل\” جوابات حاصل کرنے کی اجازت دے گا۔ شراکت دار

    Instacart کے چیف آرکیٹیکٹ JJ Zhuang نے مجھے ای میل کے ذریعے بتایا، \”گروسری کی خریداری کے لیے بہت سے عوامل جیسے بجٹ، صحت اور غذائیت، ذاتی ذوق، موسمی، کھانا پکانے کی مہارت، تیاری کا وقت، اور ترکیب کی حوصلہ افزائی کے ساتھ، ایک بڑا ذہنی بوجھ درکار ہو سکتا ہے۔\” . \”کیا ہوگا اگر AI اس ذہنی بوجھ کو اٹھا سکتا ہے، اور ہم گھریلو رہنماؤں کی مدد کر سکتے ہیں جو عام طور پر گروسری کی خریداری، کھانے کی منصوبہ بندی، اور میز پر کھانا ڈالنے کے ذمہ دار ہوتے ہیں – اور حقیقت میں گروسری کی خریداری کو حقیقی معنوں میں تفریحی بنا سکتے ہیں؟ Instacart کا AI سسٹم، OpenAI کے ChatGPT کے ساتھ مربوط ہونے پر، ہمیں بالکل ایسا کرنے کے قابل بنائے گا، اور ہم Instacart ایپ میں جو کچھ ممکن ہے اس کے ساتھ تجربہ کرنا شروع کر کے بہت خوش ہیں۔\”

    \"Instacart

    تصویری کریڈٹ: انسٹا کارٹ

    وہ لوگ جو ChatGPT ساگا کو قریب سے پیروی کر رہے ہیں، اگرچہ، یہ سوچ رہے ہوں گے کہ کیا یہ ریلیز کے لیے تیار ہے – اور بجا طور پر۔

    ابتدائی طور پر، صارفین ChatGPT کو سوالات کے جوابات دینے کے قابل تھے۔ نسل پرست اور جنس پرست طریقے، متعصب ڈیٹا کا عکس جس پر ChatGPT کو ابتدائی طور پر تربیت دی گئی تھی۔ (ChatGPT کے تربیتی اعداد و شمار میں انٹرنیٹ کے مواد کا ایک وسیع ذخیرہ شامل ہے، یعنی ای بکس، Reddit پوسٹس اور ویکیپیڈیا کے مضامین۔) چیٹ جی پی ٹی یہ انکشاف کیے بغیر حقائق بھی ایجاد کرتا ہے کہ وہ ایسا کر رہا ہے، AI میں ایک رجحان جسے کہا جاتا ہے۔ فریب.

    ChatGPT – اور اس جیسے سسٹمز – کے لیے حساس ہیں۔ فوری بنیاد پر حملے نیز، یا بدنیتی پر مبنی مخالفانہ اشارے جو انہیں ایسے کام انجام دینے پر مجبور کرتے ہیں جو ان کے اصل مقاصد کا حصہ نہیں تھے۔ پوری کمیونٹیز Reddit پر چیٹ جی پی ٹی کو \”جیل بریک\” کرنے کے طریقے تلاش کرنے اور کسی بھی حفاظتی اقدامات کو نظرانداز کرنے کے ارد گرد تشکیل دیا گیا ہے جو OpenAI نے رکھا ہے۔ کم جارحانہ مثالوں میں سے ایک میں، اسٹارٹ اپ اسکیل AI کا ایک عملہ ChatGPT حاصل کرنے کے قابل تھا ظاہر کرنا اس کے اندرونی تکنیکی کام کے بارے میں معلومات۔

    برانڈز، بلا شبہ، کراس ہیئرز میں پھنسنا نہیں چاہیں گے۔ بروک مین اٹل ہے کہ وہ نہیں ہوں گے۔ ایسا کیوں؟ ایک وجہ، وہ کہتے ہیں، پسدید پر مسلسل بہتری ہے – بعض صورتوں میں کینیا کے کنٹریکٹ ورکرز کے اخراجات. لیکن بروک مین نے ایک نئے (اور فیصلہ کن طور پر کم متنازعہ) نقطہ نظر پر زور دیا جسے OpenAI Chat Markup Language، یا ChatML کہتا ہے۔ ChatML میٹا ڈیٹا کے ساتھ پیغامات کی ترتیب کے طور پر ChatGPT API کو متن فیڈ کرتا ہے۔ یہ معیاری ChatGPT کے برعکس ہے، جو ٹوکن کی ایک سیریز کے طور پر پیش کردہ خام متن کو استعمال کرتا ہے۔ (مثال کے طور پر لفظ \”لاجواب\” کو ٹوکن \”فین\”، \”ٹاس\” اور \”ٹک\” میں تقسیم کیا جائے گا۔)

    مثال کے طور پر، \”میری 30ویں سالگرہ کے لیے پارٹی کے کچھ دلچسپ خیالات کیا ہیں؟\” ایک ڈویلپر اس پرامپٹ کو ایک اضافی پرامپٹ کے ساتھ شامل کرنے کا انتخاب کر سکتا ہے جیسے کہ \”آپ ایک تفریحی بات چیت کرنے والی چیٹ بوٹ ہیں جو صارفین کے سوالات میں ان کی مدد کرنے کے لیے ڈیزائن کیا گیا ہے۔ آپ کو سچائی اور پرلطف انداز میں جواب دینا چاہیے! یا ChatGPT API پر کارروائی کرنے سے پہلے \”آپ ایک بوٹ ہیں\”۔ بروک مین کے مطابق، یہ ہدایات ChatGPT ماڈل کے جوابات کو بہتر بنانے اور فلٹر کرنے میں مدد کرتی ہیں۔

    \”ہم ایک اعلی سطحی API پر جا رہے ہیں۔ اگر آپ کے پاس سسٹم میں ان پٹ کی نمائندگی کرنے کا زیادہ منظم طریقہ ہے، جہاں آپ کہتے ہیں، \’یہ ڈویلپر کی طرف سے ہے\’ یا \’یہ صارف کی طرف سے ہے\’ … مجھے توقع کرنی چاہیے کہ، ایک ڈویلپر کے طور پر، آپ حقیقت میں زیادہ مضبوط ہو سکتے ہیں۔ [using ChatML] اس قسم کے فوری حملوں کے خلاف، \”بروک مین نے کہا۔

    ایک اور تبدیلی جو (امید ہے کہ) غیر ارادی ChatGPT رویے کو روکے گی وہ زیادہ کثرت سے ماڈل اپ ڈیٹس ہے۔ جی پی ٹی-3.5-ٹربو کے اجراء کے ساتھ، ڈیولپرز خود بخود OpenAI کے تازہ ترین مستحکم ماڈل میں اپ گریڈ ہو جائیں گے، Brockman کا کہنا ہے کہ gpt-3.5-turbo-0301 (آج جاری) سے شروع ہو رہا ہے۔ ڈیولپرز کے پاس پرانے ماڈل کے ساتھ رہنے کا اختیار ہوگا اگر وہ ایسا کرتے ہیں، تاہم، جو کسی حد تک فائدے کی نفی کر سکتا ہے۔

    چاہے وہ جدید ترین ماڈل کو اپ ڈیٹ کرنے کا انتخاب کریں یا نہ کریں، بروک مین نوٹ کرتا ہے کہ کچھ صارفین – بنیادی طور پر بڑے کاروباری ادارے جس کے مطابق بڑے بجٹ ہوتے ہیں – وقف صلاحیت کے منصوبوں کے تعارف کے ساتھ سسٹم کی کارکردگی پر گہرا کنٹرول حاصل کریں گے۔ سب سے پہلے دستاویزات میں تفصیلی لیک اس ماہ کے شروع میں، OpenAI کے وقف صلاحیت کے منصوبے، جو آج شروع کیے گئے، صارفین کو ایک OpenAI ماڈل چلانے کے لیے کمپیوٹ انفراسٹرکچر کے مختص کے لیے ادائیگی کرنے دیں – مثال کے طور پر، gpt-3.5-turbo۔ (ویسے یہ بیک اینڈ پر Azure ہے۔)

    مثال کے بوجھ پر \”مکمل کنٹرول\” کے علاوہ – عام طور پر، مشترکہ کمپیوٹ وسائل پر OpenAI API کو کالز ہوتی ہیں – وقف صلاحیت صارفین کو طویل سیاق و سباق کی حدود جیسی خصوصیات کو فعال کرنے کی صلاحیت فراہم کرتی ہے۔ سیاق و سباق کی حدود اس متن کا حوالہ دیتے ہیں جس پر ماڈل اضافی متن بنانے سے پہلے غور کرتا ہے۔ طویل سیاق و سباق کی حدود ماڈل کو بنیادی طور پر مزید متن کو \”یاد رکھنے\” کی اجازت دیتی ہیں۔ اگرچہ اعلیٰ سیاق و سباق کی حدود تمام تعصب اور زہریلے مسائل کو حل نہیں کرسکتی ہیں، لیکن وہ gpt-3.5-turbo جیسے ماڈلز کی قیادت کرسکتی ہیں۔ کم hallucinate.

    بروک مین کا کہنا ہے کہ وقف صلاحیت والے صارفین 16k سیاق و سباق کی ونڈو کے ساتھ gpt-3.5-ٹربو ماڈل کی توقع کر سکتے ہیں، یعنی وہ معیاری ChatGPT ماڈل سے چار گنا زیادہ ٹوکن لے سکتے ہیں۔ اس سے کسی کو ٹیکس کوڈ کے صفحات اور صفحات میں چسپاں کرنے اور ماڈل سے معقول جوابات حاصل کرنے کی اجازت مل سکتی ہے، کہیے – ایک ایسا کارنامہ جو آج ممکن نہیں ہے۔

    بروک مین نے مستقبل میں عام ریلیز کا اشارہ کیا، لیکن جلد ہی نہیں۔

    بروک مین نے کہا، \”سیاق و سباق کی کھڑکیوں نے رینگنا شروع کر دیا ہے، اور اس وجہ کا ایک حصہ یہ ہے کہ ہم ابھی صرف صلاحیت کے حامل صارفین ہیں، کیونکہ ہماری طرف بہت سارے پرفارمنس ٹریڈ آفس ہیں۔\” \”ہم بالآخر اسی چیز کا آن ڈیمانڈ ورژن پیش کرنے کے قابل ہو سکتے ہیں۔\”

    اوپن اے آئی کے بڑھتے ہوئے دباؤ کو دیکھتے ہوئے a کے بعد منافع کمانا اربوں ڈالر کی سرمایہ کاری مائیکروسافٹ سے، یہ بہت حیران کن نہیں ہوگا.





    >Source link>

    >>Join our Facebook page From top right corner. <<

  • OpenAI debuts Whisper API for speech-to-text transcription and translation

    کے رول آؤٹ کے ساتھ موافق ہونا ChatGPT APIOpenAI نے آج Whisper API شروع کیا، جو اوپن سورس کا ایک میزبان ورژن ہے۔ سرگوشی اسپیچ ٹو ٹیکسٹ ماڈل جو کمپنی نے ستمبر میں جاری کیا۔

    $0.006 فی منٹ کی قیمت پر، Whisper ایک خودکار اسپیچ ریکگنیشن سسٹم ہے جس کے بارے میں OpenAI کا دعویٰ ہے کہ متعدد زبانوں میں \”مضبوط\” ٹرانسکرپشن کے ساتھ ساتھ ان زبانوں سے انگریزی میں ترجمہ بھی ممکن ہے۔ یہ M4A، MP3، MP4، MPEG، MPGA، WAV اور WEBM سمیت متعدد فارمیٹس میں فائلیں لیتا ہے۔

    لاتعداد تنظیموں نے انتہائی قابل اسپیچ ریکگنیشن سسٹمز تیار کیے ہیں، جو گوگل، ایمیزون اور میٹا جیسے ٹیک جنات کے سافٹ ویئر اور خدمات کے مرکز میں ہیں۔ لیکن جو چیز Whisper کو مختلف بناتی ہے وہ یہ ہے کہ اسے ویب سے اکٹھے کیے گئے 680,000 گھنٹے کے کثیر لسانی اور \”ملٹی ٹاسک\” ڈیٹا پر تربیت دی گئی تھی، OpenAI کے صدر اور چیئرمین گریگ بروک مین کے مطابق، جو منفرد لہجوں، پس منظر کے شور اور تکنیکی جارجن کی بہتر شناخت کا باعث بنتا ہے۔

    \”ہم نے ایک ماڈل جاری کیا، لیکن یہ حقیقت میں پورے ڈویلپر ماحولیاتی نظام کو اس کے ارد گرد تعمیر کرنے کے لیے کافی نہیں تھا،\” Brockman نے کل سہ پہر TechCrunch کے ساتھ ایک ویڈیو کال میں کہا۔ \”Whisper API وہی بڑا ماڈل ہے جسے آپ اوپن سورس حاصل کر سکتے ہیں، لیکن ہم نے انتہائی حد تک بہتر بنایا ہے۔ یہ بہت، بہت تیز اور انتہائی آسان ہے۔\”

    بروک مین کے نقطہ نظر تک، جب آواز کی نقل کی ٹیکنالوجی کو اپنانے والے کاروباری اداروں کی بات آتی ہے تو رکاوٹوں کی راہ میں بہت کچھ ہے۔ 2020 کے اعدادوشمار کے مطابق سروے، کمپنیاں درستگی، لہجہ- یا بولی سے متعلقہ شناختی مسائل اور لاگت کو سرفہرست وجوہات کے طور پر بتاتی ہیں کہ انہوں نے ٹیک ٹو اسپیچ جیسی ٹیک کو قبول نہیں کیا۔

    سرگوشی کی اپنی حدود ہیں، اگرچہ – خاص طور پر \”اگلے لفظ\” کی پیشین گوئی کے علاقے میں۔ چونکہ سسٹم کو بہت زیادہ شور مچانے والے ڈیٹا پر تربیت دی گئی تھی، اوپن اے آئی نے خبردار کیا ہے کہ وسپر اپنی نقل میں ایسے الفاظ شامل کر سکتا ہے جو حقیقت میں نہیں بولے گئے تھے – ممکنہ طور پر اس لیے کہ یہ دونوں آڈیو میں اگلے لفظ کی پیشین گوئی کرنے اور آڈیو ریکارڈنگ کو ہی نقل کرنے کی کوشش کر رہے ہیں۔ مزید برآں، Whisper تمام زبانوں میں یکساں طور پر اچھی کارکردگی کا مظاہرہ نہیں کرتا، جب ان زبانوں کے بولنے والوں کی بات آتی ہے جو تربیتی ڈیٹا میں اچھی طرح سے پیش نہیں کی جاتی ہیں تو غلطی کی شرح زیادہ ہوتی ہے۔

    بدقسمتی سے، تقریر کی شناخت کی دنیا میں یہ آخری بات کوئی نئی بات نہیں ہے۔ تعصبات نے 2020 کے اسٹینفورڈ کے ساتھ بہترین نظاموں کو بھی طویل عرصے سے دوچار کیا ہے۔ مطالعہ ایمیزون، ایپل، گوگل، آئی بی ایم اور مائیکروسافٹ کے سسٹمز تلاش کرنے میں بہت کم غلطیاں ہوئیں – تقریباً 19% – سیاہ فام صارفین کی نسبت سفید فام صارفین کے ساتھ۔

    اس کے باوجود، OpenAI دیکھتا ہے کہ موجودہ ایپس، خدمات، مصنوعات اور ٹولز کو بہتر بنانے کے لیے Whisper کی نقل کی صلاحیتوں کا استعمال کیا جا رہا ہے۔ پہلے سے ہی، AI سے چلنے والی زبان سیکھنے والی ایپ اسپیک ایک نئے درون ایپ ورچوئل بولنے والے ساتھی کو طاقت دینے کے لیے Whisper API کا استعمال کر رہی ہے۔

    اگر اوپن اے آئی اسپیچ ٹو ٹیکسٹ مارکیٹ میں بڑے پیمانے پر داخل ہوسکتا ہے، تو یہ مائیکروسافٹ کی حمایت یافتہ کمپنی کے لیے کافی منافع بخش ہوسکتا ہے۔ کے مطابق ایک رپورٹ کے مطابق، اس حصے کی مالیت 2026 تک 5.4 بلین ڈالر ہو سکتی ہے، جو 2021 میں 2.2 بلین ڈالر سے زیادہ ہے۔

    \”ہماری تصویر یہ ہے کہ ہم واقعی یہ عالمگیر ذہانت بننا چاہتے ہیں،\” بروک مین نے کہا۔ \”ڈبلیومیں واقعی میں، بہت لچکدار طریقے سے، آپ کے پاس کسی بھی قسم کا ڈیٹا لینے کے قابل ہونا چاہتا ہوں — جس قسم کا کام آپ پورا کرنا چاہتے ہیں — اور اس توجہ پر ایک قوت ضرب بننا چاہتے ہیں۔



    >Source link>

    >>Join our Facebook page From top right corner. <<

  • Microsoft-backed OpenAI to let users customize ChatGPT | The Express Tribune

    اوپن اے آئی، چیٹ جی پی ٹی کے پیچھے اسٹارٹ اپ، نے جمعرات کو کہا کہ وہ اپنے وائرل چیٹ بوٹ میں ایک اپ گریڈ تیار کر رہا ہے جسے صارفین اپنی مرضی کے مطابق بنا سکتے ہیں، کیونکہ یہ مصنوعی ذہانت میں تعصب سے متعلق خدشات کو دور کرنے کے لیے کام کرتا ہے۔

    سان فرانسسکو میں قائم سٹارٹ اپ، جسے مائیکروسافٹ کارپوریشن نے فنڈ فراہم کیا ہے اور اپنی جدید ٹیکنالوجی کو طاقت دینے کے لیے استعمال کیا ہے، نے کہا کہ اس نے سیاسی اور دیگر تعصبات کو کم کرنے کے لیے کام کیا ہے بلکہ مزید متنوع خیالات کو بھی ایڈجسٹ کرنا چاہتا ہے۔

    \”اس کا مطلب یہ ہوگا کہ سسٹم آؤٹ پٹ کی اجازت دی جائے جس سے دوسرے لوگ (خود بھی شامل ہیں) سختی سے متفق نہیں ہوسکتے ہیں،\” اس نے ایک بلاگ پوسٹ میں کہا، آگے بڑھنے کے راستے کے طور پر حسب ضرورت پیش کرتے ہوئے۔ پھر بھی، \”نظام کے رویے پر ہمیشہ کچھ پابندیاں رہیں گی۔\”

    ChatGPT، جو گزشتہ سال نومبر میں ریلیز ہوا، نے اس کے پیچھے موجود ٹیکنالوجی میں جنریٹو AI کے بارے میں غیرمعمولی دلچسپی کو جنم دیا ہے، جس کا استعمال انسانی تقریر کی نقل کرتے ہوئے جوابات پیدا کرنے کے لیے کیا جاتا ہے جس نے لوگوں کو حیران کر دیا ہے۔

    اسٹارٹ اپ کی خبر اسی ہفتے آتی ہے کہ کچھ میڈیا آؤٹ لیٹس نے نشاندہی کی ہے کہ اوپن اے آئی کے ذریعے چلنے والے مائیکروسافٹ کے نئے بنگ سرچ انجن کے جوابات ممکنہ طور پر خطرناک ہیں اور یہ ٹیکنالوجی پرائم ٹائم کے لیے تیار نہیں ہوسکتی ہے۔

    ٹیکنالوجی کمپنیاں اس نوزائیدہ ٹکنالوجی کے لیے کس طرح گارڈریلز مرتب کرتی ہیں وہ جنریٹیو AI اسپیس میں کمپنیوں کے لیے ایک اہم توجہ کا مرکز ہے جس کے ساتھ وہ اب بھی کشتی لڑ رہی ہیں۔ مائیکروسافٹ نے کہا بدھ کو کہ صارف کے تاثرات وسیع تر رول آؤٹ سے پہلے Bing کو بہتر بنانے میں مدد کر رہے تھے، مثال کے طور پر یہ سیکھنا کہ اس کے AI چیٹ بوٹ کو ایسے جوابات دینے کے لیے \”اُکسایا\” جا سکتا ہے جو اس کا ارادہ نہیں تھا۔

    اوپن اے آئی نے بلاگ پوسٹ میں کہا کہ چیٹ جی پی ٹی کے جوابات پہلے انٹرنیٹ پر دستیاب بڑے ٹیکسٹ ڈیٹا سیٹس پر تربیت یافتہ ہیں۔ دوسرے قدم کے طور پر، انسان ایک چھوٹے ڈیٹاسیٹ کا جائزہ لیتے ہیں، اور مختلف حالات میں کیا کرنا ہے اس کے لیے رہنما خطوط دیے جاتے ہیں۔

    مثال کے طور پر، اس صورت میں کہ کوئی صارف ایسے مواد کی درخواست کرتا ہے جو بالغ، پرتشدد، یا نفرت انگیز تقریر پر مشتمل ہو، انسانی جائزہ لینے والے کو ChatGPT کو کچھ ایسے جواب دینے کی ہدایت کرنی چاہیے جیسے \”میں اس کا جواب نہیں دے سکتا۔\”

    اگر کسی متنازعہ موضوع کے بارے میں پوچھا جائے تو، جائزہ لینے والوں کو ChatGPT کو سوال کا جواب دینے کی اجازت دینی چاہیے، لیکن \”ان پیچیدہ موضوعات پر صحیح نقطہ نظر اختیار کرنے کی کوشش کرنے کے بجائے، لوگوں اور تحریکوں کے نقطہ نظر کو بیان کرنے کی پیشکش کرنا چاہیے،\” کمپنی نے اپنے ایک اقتباس میں وضاحت کی۔ سافٹ ویئر کے لئے ہدایات.





    Source link

  • BuzzFeed launches Infinity Quizzes, creating personalized stories powered by OpenAI

    BuzzFeed — میڈیا سائٹ جس نے اپنا نام (لفظی) وائرل مواد کو گھمایا — میں اترا۔ بز کے وسط میں خود پچھلے مہینے جب یہ خبر سامنے آئی کہ ایسا ہوگا۔ ساتھی اس لمحے کے AI اسٹارٹ اپ کے ساتھ، OpenAI، ایک نیا AI سے چلنے والے کوئز فارمیٹ کو بنانے کے لیے، میڈیا کمپنی کے بہت مشہور کوئزز پر تعمیر صرف پچھلے سال 1.1 بلین آراء.

    اب، وہ نیا پروڈکٹ لانچ ہو رہا ہے: انفینٹی کوئز، جیسا کہ اسے کہا جاتا ہے، صارفین کو ایک بنیادی تھیم فراہم کرے گا، چند کلیدی الفاظ کے سوالات پوچھے گا، اور ان کی بنیاد پر ایک تیز، ذاتی نوعیت کا بیانیہ تیار کرے گا۔ BuzzFeed نے کہا کہ کوئزز ایک AI کے ذریعے چلائی جاتی ہیں جسے وہ \”Buzzy the Robot\” کہتے ہیں، OpenAI کے عوامی طور پر دستیاب API پر مبنی ہے جو جون 2021 سے پہلے متن، کوڈ اور معلومات کے امتزاج پر تربیت یافتہ ہے۔

    یہ شراکت آج چھ کوئزز کے ساتھ لائیو ہو رہی ہے، جس میں ویلنٹائن ڈے پر چار کھیلنا، ایک مشتہر کے ذریعے سپانسر کیا گیا، اور ایک صرف پریمیم سبسکرائبرز کے لیے: \”اپنا اپنا روم کام بنائیں،\” \”ایک بریک اپ ٹیکسٹ بنائیں،\” \”تاریخ۔ آپ کا سلیبرٹی کرش،\” \”اپنا سولف میٹ تلاش کریں (اشارہ: یہ ایک ہاؤس پلانٹ ہے)،\” \”اپنے اور اپنے دوستوں کے لیے اپنی سنیمیٹک کائنات بنائیں،\” اور \”اپنے اور اپنے دوستوں کے لیے ایک فرقہ بنائیں۔\” (یقین نہیں ہے کہ ہر کوئی ان میں سے آخری کو کتنا ہلکا پھلکا تلاش کر سکتا ہے…)

    اگر آپ نے کبھی Mad Libs یا اس جیسی کوئی چیز کھیلی ہے، تو Infinity Quizzes بہت زیادہ ان جیسے ہوتے ہیں، سوائے اس خیال کے کہ ایک تھیم پر صارف کے جوابات سے جو کہانیاں تیار ہوتی ہیں وہ نظریاتی طور پر اپنی مختلف حالتوں میں \”لامحدود\” ہوتی ہیں، اس لیے یہ نام۔ لیکن، دیگر تخلیقی AI خدمات کی طرح – خواہ وہ OpenAI کی ہو۔ چیٹ جی پی ٹی, شٹر اسٹاک کا امیج جنریٹر، یا کچھ اور – نتائج تھوڑا سا ہٹ اور مس۔ پرسنلائزیشن موجود ہے، لیکن بعض اوقات عجیب الفاظ یا کوکی کٹر کے نتائج کے ساتھ (اس مضمون کے نچلے حصے میں میں نے کی گئی چند کوششیں دیکھیں)۔

    BuzzFeed AI کے ساتھ کام کر رہا ہے۔ 2021 میں تصویر جنریٹر شروع کرنے کے بعد سےلیکن سب کچھ اسی طرح، جب OpenAI کا کام پہلی بار سامنے آیا، اس نے ایک زبردست ہلچل مچا دی۔

    بہت سارے لوگ شکوک و شبہات میں ہیں کہ AI ایک زبردست مثبت پیشرفت ہے، کچھ تو بالکل پریشان بھی سوچ میں – ایک بڑا/واضح خطرہ یہ ہے کہ یہ انسانوں اور ان کے کردار کو متروک بنا سکتا ہے۔

    لہٰذا BuzzFeed کی چھلانگ ایک ایسے اسٹارٹ اپ کے بازوؤں میں جو فی الحال جنریٹو AI پر چارج لے رہی ہے — جو انسانوں کے چھوٹے اشارے استعمال کرتا ہے تاکہ وسیع بیانیہ، موسیقی، تصاویر یا دیگر اصل مواد تیار کیا جا سکے — ایسا مواد تخلیق کرنے کے لیے جو پہلے مکمل طور پر انسانوں نے تیار کیا ہو، بہت سے لوگوں کے لیے ایک سگنل کی طرح محسوس ہوا: آپ کے خیال میں جو بھی ڈسٹوپین مستقبل قریب ہے، وہ اصل میں اس وقت یہاں موجود ہے۔

    (اس سے کوئی فائدہ نہیں ہوا کہ BuzzFeed نے OpenAI کے لیک ہونے سے چند ہفتے قبل اعلان کیا کہ ایسا ہوگا۔ اپنی افرادی قوت کا 12 فیصد نکال دیں۔.)

    یقینا، تمام ردعمل منفی نہیں تھے. BuzzFeed Nasdaq اور اس پر درج ہے۔ اداسی میں تھا OpenAI لیک ہونے سے پہلے، ہر ایک ڈالر سے کم پر حصص کی تجارت کے ساتھ۔ اس خبر نے اسٹاک کی قیمت کو آسمان کو چھونے کے لیے بھیج دیا، اور جب یہ اب پرسکون ہو گیا ہے، یہ دیکھنے کے قابل ہو گا کہ آیا اس معاہدے کا اثر ایک فلیش تھا یا کوئی ایسی چیز جو کاروبار کے لیے اور برقرار رہ سکتی ہے، یا کم از کم اس سے مزید سرمایہ کار پیدا ہو سکتے ہیں۔ جوش – اور، ہاں، buzz۔

    اس نوٹ پر، ہم نے BuzzFeed سے اس خبر کے بارے میں سوالات پوچھے ہیں، بشمول کیا وہ OpenAI کے ساتھ اپنی شراکت داری کی مالی تفصیلات میں سے کسی کا اشتراک کر سکتا ہے، اور کیا مؤخر الذکر کو اسپانسرشپ کے سودوں میں کٹوتی ملے گی۔ ان میں سے کوئی بھی تفصیلات ابھی ظاہر نہیں کی جا رہی ہیں۔

    اگرچہ سٹارٹ اپ نے واقعی دنیا کی نظروں کو اپنی گرفت میں لے لیا ہے، اور بڑے پیمانے پر مائیکروسافٹ کی طرف سے ایک بہت بڑی سرمایہ کاری کو جیب میں ڈال دیا ہے، لیکن اب بھی اس بات پر بڑے سوالیہ نشان موجود ہیں کہ جب اس کی کامیابیوں کے ارد گرد آمدنی اور منافع کی تعمیر کی بات آتی ہے تو کیا قائم رہے گا۔

    اور، یہ دیکھتے ہوئے کہ اعداد و شمار کے ذرائع کے ارد گرد کچھ اہم مسائل پیدا ہوئے ہیں جو تخلیقی AI الگورتھم کو کھلاتے ہیں۔ مقدمہ Getty اور Stability AI کے درمیان صرف ایک مسئلہ کو اجاگر کرنا — ہم نے اس بارے میں بھی پوچھا ہے کہ انفینٹی کوئزز میں ڈیٹا ان پٹ کا کیا ہوتا ہے، بشمول یہ کہ آیا یہ داستانوں سے ہٹ کر کہیں اور استعمال ہوتا ہے۔

    \”BuzzFeed فی الحال کارکردگی کو بہتر بنانے کے لیے OpenAI کے گمنام اشارے اور نتائج کو محفوظ کرتا ہے۔ OpenAI میں صارف کے ڈیٹا کی حفاظت کے لیے ڈیٹا پرائیویسی اور سیکیورٹی پالیسیاں موجود ہیں،\”ایک ترجمان نے کہا. یہ ڈیٹا کو یہ بتانے میں بھی مدد کرے گا کہ بعد میں کون سے کوئز بنائے گئے ہیں۔

    انسانوں کو مساوات سے مکمل طور پر ہٹانے کے موضوع پر، اگرچہ، ایسا لگتا ہے کہ BuzzFeed ایسا نہیں کر رہا ہے – اس وقت نہیں، کم از کم۔ کمپنی کا کہنا ہے کہ کوئزز اور اس کے نتیجے میں آنے والی کہانیاں دونوں کے درمیان باہمی تعاون کی کوشش ہے۔ BuzzFeed کے کوئز لکھنے والے، \”AI ٹیکنالوجی، اب سے \’Buzzy The Robot،\’ (آفیشل ٹائٹل: BuzzFeed\’s AI Creative Assistant)\” اور خود کوئز لینے والے۔

    ابھی ایسا لگتا ہے۔ ہونا بہت زیادہ بھاری لفٹنگ بھی – بہت سارے ٹیسٹ اور اس بات کو یقینی بنانے کے لیے موافقت کرنا نتائج تفریحی اور نقطہ پر ہیں. وہ چاہئے آو کیاwn وقت کے ساتھ.

    \”BuzzFeed میں، تخلیقی ٹیم کا AI کو مربوط کرنے کے لیے ایسا مواد تیار کرنا ہے جو \”AI-آبائی\” ہو یا مصنوعی ذہانت کے بغیر موجود نہ ہو (جیسے کہ لامحدود تعداد میں فوری، ذاتی نوعیت کے کوئز نتائج)؛ اور وہ چیزیں جو انسانوں کے ذریعہ تخلیق کی گئی ہیں لیکن AI کے ذریعہ *بڑھائی گئی ہیں،\” کمپنی نوٹ کرتی ہے۔

    \"\"\"\"\"\"



    Source link