AI
🇨🇳 କିମି AI କ’ଣ? ଚାଇନାର ଚାଟବଟ୍ ପ୍ରମୁଖ ବେଞ୍ଚମାର୍କରେ ChatGPT, Claudeକୁ ପଛରେ ପକାଇଲା

ବର୍ଷ ଆରମ୍ଭରେ, DeepSeekର ଚମତ୍କାରୀ ପ୍ରଦର୍ଶନ AI ଦୌଡ଼ରେ ଆମେରିକାର ଅବିରତ ଆଧିପତ୍ୟର ସମସ୍ତ ଧାରଣାକୁ ସମାପ୍ତ କରିଦେଲା, କାରଣ ଏହି ଚାଇନିଜ୍ ଚାଟବଟ୍ ଦେଖାଇଲା ଯେ ଅତି କମ୍ ଖର୍ଚ୍ଚରେ ChatGPT ଏବଂ Geminiରେ ବ୍ୟବହୃତ ମଡେଲ୍ ଭଳି ଶକ୍ତିଶାଳୀ ମଡେଲ୍ ତିଆରି କରିବା ସମ୍ଭବ। ସେହି ଦିନଠାରୁ ଚୀନରୁ ଅନେକ AI କମ୍ପାନୀ ଆସିଛନ୍ତି, ଯେଉଁଥିରେ Alibabaର Qwen, Baiduର Ernie, ଏବଂ Moonshot AIର Kimi ଅନ୍ତର୍ଭୁକ୍ତ।
ଏହି ନୂତନ ଚାଇନିଜ୍ ମଡେଲଗୁଡ଼ିକ ChatGPT ଭଳି ପାଶ୍ଚାତ୍ୟ ମଡେଲଗୁଡ଼ିକ ସହିତ ବ୍ୟବଧାନକୁ ହ୍ରାସ କରିବାରେ ଲାଗିଛନ୍ତି। ତେବେ, ଏକ ନୂଆ Kimi ମଡେଲ୍ ବର୍ତ୍ତମାନ ଅନେକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ବେଞ୍ଚମାର୍କରେ ChatGPT ଏବଂ Anthropicର Claudeକୁ ମଧ୍ୟ ପଛରେ ପକାଇ ଦେଇଛି।
କିମି K2 Thinkingର ଚମତ୍କାର ପ୍ରଦର୍ଶନ:
- Moonshot AI ତରଫରୁ Kimi K2 Thinking ମଡେଲ୍ ମୁକ୍ତିଲାଭ କରିଛି, ଯାହା GPT-5 ଏବଂ Claude Sonnet 4.5 Thinking ଭଳି ମଡେଲ୍ ସହିତ ସିଧାସଳଖ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱିତା କରୁଛି।
- କମ୍ପାନୀ ଦ୍ୱାରା ଦିଆଯାଇଥିବା ତଥ୍ୟ ଅନୁଯାୟୀ, K2 Thinking ସର୍ବାଧିକ ଆକାଂକ୍ଷିତ “Humanity’s Last Exam” (HLE) ବେଞ୍ଚମାର୍କରେ ChatGPT ଏବଂ Claude ଉଭୟଙ୍କୁ ପରାସ୍ତ କରିଛି।
- HLEର (କେବଳ ଟେକ୍ସଟ୍) ମୂଲ୍ୟାଙ୍କନରେ, Kimi K2 Thinking 44.9% ସ୍କୋର୍ କରିଛି, ଯାହା GPT-5 (High)ର 41.7% ଏବଂ Claude Sonnet 4.5 Thinkingର 32% ସ୍କୋର୍ ଠାରୁ ଅଧିକ।
- ଏଜେଣ୍ଟିକ୍ ୱେବ୍-ବ୍ରାଉଜିଂ ଏବଂ ସନ୍ଧାନ ସମ୍ବନ୍ଧୀୟ କାର୍ଯ୍ୟଗୁଡ଼ିକରେ AI ଚାଟବଟଗୁଡ଼ିକର କାର୍ଯ୍ୟଦକ୍ଷତା ବିଶ୍ଳେଷଣ କରୁଥିବା BrowseComp ବେଞ୍ଚମାର୍କରେ ମଧ୍ୟ ସମାନ ଫଳାଫଳ ଦେଖିବାକୁ ମିଳିଛି, ଯେଉଁଠାରେ Kimi K2 Thinking 60.2% ସ୍କୋର୍ କରିଛି।
- ଏହାର ତୁଳନାରେ GPT-5 54.9% ଏବଂ Claude Sonnet 4.5 Thinking 24.1% ସ୍କୋର୍ କରିଛି।



