株式会社ずんだもん技術室AI放送局 Podcast By 株式会社ずんだもん技術室AI放送局 cover art

株式会社ずんだもん技術室AI放送局

株式会社ずんだもん技術室AI放送局

By: 株式会社ずんだもん技術室AI放送局
Listen for free

About this listen

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。(MC 月:春日部つむぎ、火水木:ずんだもん、金:お嬢様ずんだもん)
Episodes
  • 株式会社ずんだもん技術室AI放送局 podcast 20250709
    Jul 8 2025
    関連リンク Introducing Deep Research in Azure AI Foundry Agent Service マイクロソフトが、Azure AI Foundry Agent Service向けに「Deep Research(ディープリサーチ)」のパブリックプレビューを発表しました。これは、OpenAIの高度なAIエージェント技術をAzure上で利用できるようにするものです。AIエージェントとは、指示に基づいて自動で情報を探し、分析し、タスクを実行するプログラムのことです。 Deep Researchを使うと、企業は複雑なウェブ調査を自動化できるようになります。例えば、市場分析や競合調査、規制報告書の作成など、これまでは人が時間をかけて行っていた調査業務を、AIが代行できるようになります。 このサービスの主なポイントは以下の通りです。 広範囲なウェブ調査の自動化: Bing検索と連携し、ウェブ上の膨大な情報から必要なものを正確に見つけ出します。調査結果には引用元が明記されるため、情報の信頼性を確認しやすいのが特徴です。プログラムから利用できるAIエージェント: チャット形式だけでなく、APIやSDKを使って、他のアプリケーションやワークフローからDeep Researchの機能を呼び出すことができます。これにより、調査機能を既存のビジネスシステムに組み込んだり、繰り返し実行する自動処理の一部にしたりすることが可能です。複雑な業務フローの自動化: Azure FunctionsやLogic Appsといった他のAzureサービスと組み合わせることで、調査だけでなく、その結果を元にしたレポート作成や通知といった一連の複雑な業務プロセス全体を自動化できます。高い透明性と企業での利用への対応: 調査の過程や判断の根拠、参照した情報源がすべて記録されるため、結果の透明性が高く、企業内のセキュリティやコンプライアンス(法令遵守)の基準を満たしながら利用できます。 Deep Researchの仕組みは、まずAIが与えられた質問を正確に理解し、Bing検索で関連性の高い最新情報を収集します。次に、収集した情報をもとに深く思考し、分析を行い、最終的な回答をまとめます。この際、単なる情報の要約ではなく、新しい洞察やパターンを見つけ出すこともできます。出力されるレポートには、AIがどのように推論し、どの情報源を参照したかが詳しく記載されます。 このサービスは、現在限定パブリックプレビューとして提供されており、利用にはサインアップが必要です。料金は、AIが処理するトークン(テキストの単位)の量に基づいて計算されます。 Deep Researchは、AIエージェントがビジネスの様々な場面で活用される未来に向けた、重要な一歩となるでしょう。 引用元: https://azure.microsoft.com/en-us/blog/introducing-deep-research-in-azure-ai-foundry-agent-service/ 退屈なことは Devin にやらせよう: Booster開発チームでのリアルなAI活用事例 Repro Booster開発チームでは、AIを開発業務だけでなく、ドキュメント作成や顧客対応まで幅広く活用し、業務効率を大幅に向上させています。 中心となるのは、自分で考えて作業を進めるAIエージェント「Devin」です。Devinは、Slackや専用画面から指示されたバグ修正や新機能の実装タスクを受け持ちます。自分でコードを解析し、修正案を「Pull Request(プルリクエスト、コード変更の提案)」として作成するだけでなく、人間のレビューコメントに合わせて修正も自動で行います。特に、Devinが過去の会話や指示から知識を学習・記憶し、その後のアウトプットに活かす「Knowledge機能」によって、その性能は導入当初よりも大きく向上し、より質の高い成果物を出せるようになっています。 個々のエンジニアも、コーディングを支援するAIツールを積極的に利用しています。例えば、「Claude Code」は新しいプロジェクトの土台コードを素早く生成するのに役立ちます。また、Devinが作ったプルリクエストをGoogle Geminiという別のAIにレビューさせるという、AI同士でのコードレビューも試されており、異なるAIの組み合わせによってレビューの質が高まる効果が実感されています。 開発以外の領域でもAIは活躍しています。ChatGPTやDevinは、バグ修正後の関連ドキュメントの更新やリリースノートの作成を自動化します。プロダクトマネージャーは、AIを使って口頭での...
    Show more Show less
    Less than 1 minute
  • 株式会社ずんだもん技術室AI放送局 podcast 20250708
    Jul 7 2025
    関連リンク Mercury: Ultra-Fast Language Models Based on Diffusion 「Mercury」は、拡散モデルという新しい技術を取り入れた、次世代の大規模言語モデル(LLM)です。これまでのLLMは一つずつ単語やコードを生成していましたが、Mercuryは複数の単語やコードの断片を同時に予測して生成できる点が画期的です。これにより、非常に高速な動作が可能になりました。これは、LLMの基盤技術であるTransformerアーキテクチャを使いながら、同時に複数の要素を予測できるように学習させる新しいアプローチで実現されています。 特に注目されているのは、プログラミングコードの生成に特化した「Mercury Coder」というモデルです。このモデルには「Mini」と「Small」の2つのサイズがあります。独立した評価機関によるテストでは、Mercury Coder Miniが1秒あたり1109トークン、Mercury Coder Smallが1秒あたり737トークンという驚異的な処理速度を記録しました。これは、現在速度に特化した最先端のLLMと比較しても、平均で最大10倍も高速でありながら、生成されるコードの品質は同等レベルを保っていることを示しています。 さらに、実際の開発者が利用する評価プラットフォーム「Copilot Arena」では、Mercury Coderは品質面で全モデル中2位にランクインし、速度においては全モデルの中で最速を記録しました。これは、論文上の数値だけでなく、実際の開発現場でもその優れた性能が認められていることを意味します。 開発元のInception Labsは、この「Mercury Coder」を外部サービスから利用できるパブリックAPIと、無料で試せるプレイグラウンドも公開しています。新人エンジニアの皆さんにとって、日々のコーディング作業を劇的に効率化し、AIを活用した開発のスピードを飛躍的に向上させる可能性を秘めた、まさに画期的な技術の登場と言えるでしょう。この超高速LLMの登場は、AI開発の未来を大きく変える「ブレイクスルー」となるでしょう。 引用元: https://arxiv.org/abs/2506.17298 LLM Inference Benchmarking: Performance Tuning with TensorRT-LLM 大規模言語モデル(LLM)を実際に使う際、その「推論性能」はとても重要です。どれだけ速く、たくさんのユーザーのリクエストを処理できるかが、ユーザー体験やサービスの効率を大きく左右します。この記事では、NVIDIAが提供するオープンソースのAI推論エンジン「TensorRT-LLM」を使って、LLMの性能を最大限に引き出すためのベンチマークとチューニング方法を、新人エンジニアにも分かりやすく解説しています。 まず、LLMの性能を測るためのツール「trtllm-bench」の使い方が紹介されています。このツールを使うことで、実際にLLMを動かすことなく、モデルの性能を簡単に測定・分析できます。ベンチマークを行うには、GPU環境の準備と、テスト用のデータセットを用意します。データセットは、質問とそれに対する期待される回答の長さなどを指定して作成します。 ベンチマークを実行すると、様々な性能指標が得られます。特に注目すべきは、「Request Throughput(1秒あたりのリクエスト処理数)」、「Total Output Throughput(1秒あたりの出力トークン数)」、そしてユーザー体験に直結する「Average time-to-first-token [TTFT](最初のトークンが出るまでの時間)」や「Average time-per-output-token [TPOT](トークンごとの生成時間)」です。これらの指標を分析し、アプリケーションの目的に合わせて最適なバランスを見つけることが、性能チューニングの鍵となります。例えば、ユーザーへの応答速度を重視するなら「Per User Output Speed」という指標を最大化するように調整します。 記事では、データの精度を少し落とす代わりに処理を高速化する「FP8量子化」されたモデルと、標準の「FP16」モデルを比較し、FP8モデルがより多くの同時ユーザーを処理できる例を示しています。このように、trtllm-benchを使えば、さまざまな設定を試して、どの設定が一番効率的かをグラフで視覚的に確認できます。 最適な設定が見つかったら、それを「trtllm-serve」というツールを使って、LLMを動かすサーバーに適用します。trtllm-serveはOpenAI互換のAPIを提供するため、チューニングされたLLMをアプリケーションから簡単に呼び出して利用...
    Show more Show less
    Less than 1 minute
  • マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20250707
    Jul 6 2025
    関連リンク Genspark、ノーコードAIエージェント「Super Agent」にGPT-4.1とOpenAI Realtime APIを搭載 AI技術は日々進化しており、私たちエンジニアの仕事のやり方も大きく変わりつつあります。今回ご紹介するのは、AIスタートアップのGensparkが開発した画期的なAIエージェント「Super Agent」です。この「Super Agent」は、OpenAIの最新AIモデル「GPT-4.1」と、リアルタイムなやり取りを可能にする「OpenAI Realtime API」という、OpenAIの最先端技術を搭載して公開されました。 「Super Agent」の最大の特徴は、その名の通り「ノーコード」、つまりプログラミングの知識がなくても誰でも簡単にAIを使いこなせる点です。文章で指示を出すだけで、AIが自律的に動いて、これまで人が手間をかけていた様々なタスクを自動で処理してくれます。例えば、情報収集、データの整理、レポート作成、さらには電話をかけるといった、一連の複雑な業務プロセス全体を、AIが連携して実行してくれるのです。これは、まるであなたの仕事をサポートしてくれる、非常に賢い「AIの代理人」を手に入れるようなものです。 このAIエージェントの賢さの秘密は、裏側で9種類もの大規模言語モデル(LLM)と80種類以上のツールを組み合わせて利用していることにあります。AIは、指示されたタスクの内容に応じて、最適な大規模言語モデルやツールを自動的に選び出し、それらを連携させて処理を進めます。これにより、複雑な問題も効率的に解決できるよう設計されています。特に、中核を担う「GPT-4.1」は、非常に長い指示や膨大な量の情報を一度に理解し、記憶しながら作業を進めることができるため、多岐にわたるリサーチや、構造化された精度の高いアウトプットが期待できます。また、OpenAIの画像生成モデル「GPT-image-1」も利用されており、必要に応じて画像を生成する能力も持っています。 具体的な活用例として紹介されているのが「Call For Me」機能です。これは、ユーザーに代わってAIが自動で電話をかけ、まるで人間が話すように会話を進めてくれるというものです。このように、「Super Agent」は単に情報を生成するだけでなく、現実世界での具体的な行動までAIが行う未来を見せてくれます。 GensparkはOpenAIと密接に連携しており、OpenAIの専門家からベストプラクティス(一番良いやり方)やワークフローの調整、AIモデルの性能を最大限に引き出すためのアドバイスを受けてきたとのことです。この協力関係が、「Super Agent」の素早い開発とリリースに大きく貢献しています。 このようなAIエージェントの進化は、私たちエンジニアが日常業務から解放され、より創造的で戦略的な仕事に集中できるようになる可能性を秘めています。新人エンジニアの皆さんにとっても、AI技術がどのように進化し、どのような新しいサービスを生み出しているのかを知る良い機会になるでしょう。’ 引用元: https://codezine.jp/article/detail/21843 Agentic coding革命が “成った” 世界で…… AI技術の進化により、ソフトウェア開発に大きな変化が訪れています。この記事では、「Agentic coding(エージェンティック・コーディング)」、特に「vibe coding(バイブ・コーディング)」と呼ばれる新しい開発スタイルについて解説しています。vibe codingとは、自然言語でAIの「コーディングエージェント」に指示を出し、それを使ってソフトウェアを開発していく方法のことです。 筆者によると、この変化はすでに「革命」として実現しており、過去1ヶ月間では仕事で作成するコードの約8割がAIエージェントによるものだそうです。この割合は今後さらに増え、1年以内には9割を超えるだろうと予測されています。AIエージェントの活用によって、コードを「生産」するスピードがこれまでの数倍になり、これまで時間やコストの制約で「やらない」と判断されていたようなことも「やる」という選択肢が生まれるようになりました。これは、開発の「量」が「質」に転化するような大きな変化です。 この革命により、ソフトウェアエンジニアに求められるスキルも大きく変わってきています。例えば、AIエージェントは大量のコードを書くのが得意なため、...
    Show more Show less
    Less than 1 minute
No reviews yet