প্রকাশিত: 30 জানুয়ারী, 2025
ওয়েবে অনেক WebAssembly অ্যাপ্লিকেশন মাল্টিথ্রেডিং থেকে উপকৃত হয়, একইভাবে নেটিভ অ্যাপ্লিকেশনগুলির মতো। একাধিক থ্রেড সমান্তরালে আরও কাজ করতে দেয় এবং লেটেন্সি সমস্যা এড়াতে প্রধান থ্রেড থেকে ভারী কাজ সরিয়ে দেয়। সম্প্রতি অবধি, কিছু সাধারণ ব্যথার পয়েন্ট ছিল যা এই ধরনের মাল্টিথ্রেডেড অ্যাপ্লিকেশনগুলির সাথে ঘটতে পারে, বরাদ্দ এবং I/O সম্পর্কিত। ভাগ্যক্রমে, এমস্ক্রিপ্টেনের সাম্প্রতিক বৈশিষ্ট্যগুলি সেই সমস্যাগুলির সাথে অনেক সাহায্য করতে পারে। এই নির্দেশিকাটি দেখায় যে কীভাবে এই বৈশিষ্ট্যগুলি কিছু ক্ষেত্রে 10 গুণ বা তার বেশি গতির উন্নতি ঘটাতে পারে।
স্কেলিং
নিম্নলিখিত গ্রাফটি একটি বিশুদ্ধ গণিত কাজের চাপে দক্ষ মাল্টিথ্রেডেড স্কেলিং দেখায় ( আমরা এই নিবন্ধে যে বেঞ্চমার্কটি ব্যবহার করব তা থেকে):
এটি বিশুদ্ধ গণনা পরিমাপ করে, এমন কিছু যা প্রতিটি সিপিইউ কোর নিজেরাই করতে পারে, তাই আরও কোরের সাথে কর্মক্ষমতা উন্নত হয়। দ্রুত পারফরম্যান্সের এই ধরনের একটি অবরোহী লাইন ঠিক কী ভালো স্কেলিং দেখায়। এবং এটি দেখায় যে ওয়েব প্ল্যাটফর্মটি মাল্টিথ্রেডেড নেটিভ কোড খুব ভালভাবে চালাতে পারে, সমান্তরালতার ভিত্তি হিসাবে ওয়েব কর্মীদের ব্যবহার করে, সত্যিকারের নেটিভ কোডের পরিবর্তে Wasm ব্যবহার করে এবং অন্যান্য বিবরণ যা কম অনুকূল মনে হতে পারে।
গাদা ব্যবস্থাপনা: malloc
/ free
malloc
এবং free
হল সমস্ত লিনিয়ার-মেমরি ল্যাঙ্গুয়েজ (উদাহরণস্বরূপ, C, C++, Rust, এবং Zig) সমস্ত মেমরি পরিচালনা করার জন্য যা সম্পূর্ণরূপে স্থির নয় বা স্ট্যাকের উপর নির্ভর করে। Emscripten ডিফল্টরূপে dlmalloc
ব্যবহার করে, যা একটি কম্প্যাক্ট কিন্তু কার্যকরী বাস্তবায়ন (এটি emmalloc
সমর্থন করে, যা কিছু ক্ষেত্রে আরও কমপ্যাক্ট কিন্তু ধীর)। যাইহোক, dlmalloc
এর মাল্টিথ্রেড কর্মক্ষমতা সীমিত কারণ এটি প্রতিটি malloc
/ free
এ একটি লক লাগে (কারণ একটি একক বিশ্ব বরাদ্দকারী আছে)। অতএব, আপনি যদি একবারে অনেক থ্রেডে অনেকগুলি বরাদ্দ রাখেন তবে আপনি বিতর্ক এবং ধীরগতির মধ্যে পড়তে পারেন। আপনি যখন একটি অবিশ্বাস্যভাবে malloc
-heavy বেঞ্চমার্ক চালান তখন কী ঘটে তা এখানে:
শুধুমাত্র আরো কোর দিয়ে কর্মক্ষমতা উন্নত হয় না, কিন্তু এটি খারাপ থেকে খারাপ হয়ে যায়, কারণ প্রতিটি থ্রেড malloc
লকের জন্য দীর্ঘ সময়ের জন্য অপেক্ষা করে। এটি সম্ভব সবচেয়ে খারাপ ক্ষেত্রে, কিন্তু পর্যাপ্ত বরাদ্দ থাকলে বাস্তব কাজের চাপে এটি ঘটতে পারে।
mimalloc
dlmalloc
এর মাল্টিথ্রেড-অপ্টিমাইজ করা সংস্করণ বিদ্যমান, যেমন ptmalloc3
, যা প্রতি থ্রেডে একটি পৃথক বরাদ্দকারী উদাহরণ প্রয়োগ করে, বিতর্ক এড়িয়ে যায়। মাল্টিথ্রেডিং অপ্টিমাইজেশান সহ আরও বেশ কিছু বরাদ্দকারী বিদ্যমান, যেমন jemalloc
এবং tcmalloc
. Emscripten সাম্প্রতিক mimalloc
প্রজেক্টের উপর ফোকাস করার সিদ্ধান্ত নিয়েছে, যা খুব ভালো বহনযোগ্যতা এবং কর্মক্ষমতা সহ মাইক্রোসফ্ট থেকে একটি সুন্দরভাবে ডিজাইন করা বরাদ্দকারী। নিম্নলিখিত হিসাবে এটি ব্যবহার করুন:
emcc -sMALLOC=mimalloc
এখানে mimalloc
ব্যবহার করে malloc
বেঞ্চমার্কের ফলাফল রয়েছে:
নিখুঁত! এখন কার্যক্ষমতা স্কেল দক্ষতার সাথে, প্রতিটি কোরের সাথে দ্রুত এবং দ্রুততর হচ্ছে।
আপনি যদি শেষ দুটি গ্রাফে একক -কোর পারফরম্যান্সের ডেটা মনোযোগ সহকারে দেখেন, আপনি দেখতে পাবেন যে dlmalloc
2660 ms এবং mimalloc
মাত্র 1466 নিয়েছে, যা প্রায় 2 বার গতির উন্নতি৷ এটি দেখায় যে এমনকি একটি একক-থ্রেডেড অ্যাপ্লিকেশনেও আপনি mimalloc
এর আরও পরিশীলিত অপ্টিমাইজেশান থেকে সুবিধাগুলি দেখতে পারেন, যদিও মনে রাখবেন যে এটি কোড আকার এবং মেমরি ব্যবহারের খরচে আসে (যে কারণে, dlmalloc
ডিফল্ট থাকে)।
ফাইল এবং I/O
অনেক অ্যাপ্লিকেশন বিভিন্ন কারণে ফাইল ব্যবহার করতে হবে. উদাহরণস্বরূপ, একটি গেমের স্তরগুলি লোড করতে, বা একটি চিত্র সম্পাদকের ফন্টগুলি৷ এমনকি printf
মতো একটি অপারেশনও হুডের নিচে ফাইল সিস্টেম ব্যবহার করে, কারণ এটি stdout
এ ডেটা লিখে প্রিন্ট করে।
একক-থ্রেডেড অ্যাপ্লিকেশনগুলিতে, এটি সাধারণত একটি সমস্যা নয়, এবং Emscripten স্বয়ংক্রিয়ভাবে সম্পূর্ণ ফাইল সিস্টেম সমর্থনে লিঙ্ক করা এড়াবে যদি আপনার প্রয়োজন হয় printf
। যাইহোক, যদি আপনি ফাইল ব্যবহার করেন, তাহলে মাল্টিথ্রেডেড ফাইল সিস্টেম অ্যাক্সেস করা কঠিন কারণ ফাইল অ্যাক্সেস থ্রেডগুলির মধ্যে সিঙ্ক্রোনাইজ করা আবশ্যক। Emscripten-এ মূল ফাইল সিস্টেম বাস্তবায়ন, যাকে "JS FS" বলা হয় কারণ এটি জাভাস্ক্রিপ্টে প্রয়োগ করা হয়েছিল, শুধুমাত্র মূল থ্রেডে ফাইল সিস্টেম বাস্তবায়নের সহজ মডেল ব্যবহার করা হয়েছিল। যখনই অন্য থ্রেড একটি ফাইল অ্যাক্সেস করতে চায়, এটি প্রধান থ্রেডে একটি অনুরোধ প্রক্সি করে। এর মানে হল যে অন্য থ্রেডগুলি ক্রস-থ্রেড অনুরোধে ব্লক করে, যা প্রধান থ্রেড শেষ পর্যন্ত পরিচালনা করে।
এই সাধারণ মডেলটি সর্বোত্তম যদি শুধুমাত্র প্রধান থ্রেড ফাইলগুলি অ্যাক্সেস করে, যা একটি সাধারণ প্যাটার্ন। যাইহোক, যদি অন্য থ্রেডগুলি পড়তে এবং লিখতে পারে, তাহলে সমস্যাগুলি ঘটবে। প্রথমত, মূল থ্রেডটি অন্যান্য থ্রেডের জন্য কাজ করে যা ব্যবহারকারীর দৃশ্যমান লেটেন্সি সৃষ্টি করে। তারপরে, ব্যাকগ্রাউন্ড থ্রেডগুলি তাদের প্রয়োজনীয় কাজ করার জন্য প্রধান থ্রেড বিনামূল্যে হওয়ার জন্য অপেক্ষা করে, তাই জিনিসগুলি ধীর হয়ে যায় (অথবা, আরও খারাপ, যদি মূল থ্রেডটি বর্তমানে সেই কর্মী থ্রেডে অপেক্ষা করে থাকে তবে আপনি একটি অচলাবস্থায় শেষ হতে পারেন)।
WasmFS
এই সমস্যাটি সমাধান করার জন্য, Emscripten এর একটি নতুন ফাইল সিস্টেম বাস্তবায়ন রয়েছে, WasmFS । WasmFS C++ এ লেখা এবং Wasm-এ কম্পাইল করা হয়েছে, জাভাস্ক্রিপ্টে থাকা আসল ফাইল সিস্টেমের বিপরীতে। WasmFS ন্যূনতম ওভারহেড সহ একাধিক থ্রেড থেকে ফাইল সিস্টেম অ্যাক্সেস সমর্থন করে, ফাইলগুলিকে Wasm লিনিয়ার মেমরিতে সংরক্ষণ করে, যা সমস্ত থ্রেডের মধ্যে ভাগ করা হয়। সমস্ত থ্রেড এখন সমান কর্মক্ষমতা সহ ফাইল I/O করতে পারে এবং প্রায়শই তারা একে অপরকে ব্লক করা এড়াতে পারে।
একটি সাধারণ ফাইল সিস্টেম বেঞ্চমার্ক পুরানো JS FS এর তুলনায় WasmFS এর বিশাল সুবিধা দেখায়।
এটি সরাসরি মূল থ্রেডে চলমান ফাইল সিস্টেম কোডকে একটি একক থ্রেডে চালানোর সাথে তুলনা করে। পুরানো জেএস এফএস-এ, প্রতিটি ফাইল সিস্টেম অপারেশনকে প্রধান থ্রেডের সাথে প্রক্সি করা আবশ্যক, যা এটিকে একটি থ্রেডে ধীর গতির একটি ক্রম ধরে করে! কারণ শুধু কিছু বাইট পড়া/লেখার পরিবর্তে, JS FS ক্রস-থ্রেড কমিউনিকেশন করে, যার মধ্যে লক, একটি সারি এবং অপেক্ষা জড়িত। বিপরীতে, WasmFS সমানভাবে যেকোনো থ্রেড থেকে ফাইল অ্যাক্সেস করতে পারে, এবং তাই চার্ট দেখায় যে মূল থ্রেড এবং একটি pthread এর মধ্যে কার্যত কোন পার্থক্য নেই। ফলস্বরূপ, WasmFS একটি pthread এ থাকাকালীন JS FS থেকে 32 গুণ দ্রুত।
উল্লেখ্য যে প্রধান থ্রেডে একটি পার্থক্য রয়েছে যেখানে WasmFS 2 গুণ দ্রুত। কারণ জেএস এফএস প্রতিটি ফাইল সিস্টেম অপারেশনের জন্য জাভাস্ক্রিপ্টকে কল করে, যা WasmFS এড়িয়ে যায়। WasmFS শুধুমাত্র প্রয়োজন হলে JavaScript ব্যবহার করে (উদাহরণস্বরূপ, একটি ওয়েব API ব্যবহার করার জন্য), যা Wasm-এ বেশিরভাগ WasmFS ফাইল ছেড়ে যায়। এছাড়াও, এমনকি যখন JavaScript প্রয়োজন হয়, WasmFS মূল থ্রেডের পরিবর্তে একটি সহায়ক থ্রেড ব্যবহার করতে পারে, যাতে ব্যবহারকারী-দৃশ্যমান লেটেন্সি এড়াতে পারে। এই কারণে আপনি WasmFS ব্যবহার করে গতির উন্নতি দেখতে পারেন যদিও আপনার অ্যাপ্লিকেশন মাল্টিথ্রেডেড না হয় (বা যদি এটি মাল্টিথ্রেডেড হয় তবে শুধুমাত্র মূল থ্রেডে ফাইল ব্যবহার করে)।
নিম্নলিখিত হিসাবে WasmFS ব্যবহার করুন:
emcc -sWASMFS
WasmFS উৎপাদনে ব্যবহৃত হয় এবং স্থিতিশীল বলে বিবেচিত হয়, তবে এটি এখনও পুরানো JS FS-এর সমস্ত বৈশিষ্ট্য সমর্থন করে না। অন্যদিকে, এতে মূল প্রাইভেট ফাইল সিস্টেমের জন্য সমর্থনের মতো কিছু গুরুত্বপূর্ণ নতুন বৈশিষ্ট্য অন্তর্ভুক্ত রয়েছে (OPFS, যা ক্রমাগত স্টোরেজের জন্য অত্যন্ত সুপারিশ করা হয়)। যদি না আপনার এমন একটি বৈশিষ্ট্যের প্রয়োজন হয় যা এখনও পোর্ট করা হয়নি, Emscripten টিম WasmFS ব্যবহার করার পরামর্শ দেয়।
উপসংহার
আপনার যদি একটি মাল্টিথ্রেডেড অ্যাপ্লিকেশন থাকে যা প্রচুর বরাদ্দ করে বা ফাইল ব্যবহার করে, তাহলে আপনি WasmFS এবং/অথবা mimalloc
ব্যবহার করে অনেক উপকৃত হতে পারেন। এই পোস্টে বর্ণিত পতাকাগুলির সাথে পুনরায় কম্পাইল করে একটি Emscripten প্রকল্পে চেষ্টা করা উভয়ই সহজ।
আপনি যদি থ্রেডগুলি ব্যবহার না করেন তবে আপনি সেই বৈশিষ্ট্যগুলিও চেষ্টা করতে চাইতে পারেন: যেমনটি আগে উল্লেখ করা হয়েছে, আরও আধুনিক বাস্তবায়নগুলি অপ্টিমাইজেশনের সাথে আসে যা কিছু ক্ষেত্রে একক কোরেও লক্ষণীয়।