Murakawa Takuya

Murakawa Takuya

Fullstack Development×Computer Vision Research

Bio

スケジュールはいつもギチギチです。忙しい時期には1日15時間作業します。新しいものを試したり、便利なものを取り入れるのが好きです。
フルスタックweb開発とコンピュータビジョン系の研究を主とし、研究室のサーバー・GPUの整備やコンピュータビジョン系の勉強会の幹事など幅広く活動しています。

Motto

The only place where success comes before work is in the dictionary.

「努力」の前に「成功」が来るのは辞書の中だけ。

Strengths
挑戦心
キャッチアップ力
スピード感
継続力
Qualifications
応用情報技術者試験
TOEIC LR 895点
実用英語技能検定 準一級

Skills

Web Full Stack

End-to-end web application development

FrontendBackendInfrastructure

Computer Vision Research

ML research & deep learning models

Machine LearningCV ResearchDiffusion

Server / GPU Management

Research infrastructure

CUDALinux

Timeline

  1. ハッカソン開発

    ソフトバンクグループ株式会社主催 Pepper社会貢献プログラム 中学生部門 - 市内優勝 / 全国大会出場

    • 市がソフトバンクグループと提携し、技術の授業でペッパー君のプログラミングを行う
    • 中学生部門において市内で最優秀作品に選出
    • 全国トップ10の作品に選出され、全国大会に出場
    • 薬の飲み忘れや飲み間違いなどの事故を防ぐための『薬服用確認プログラム』を開発
  2. 所属・活動開発

    プログラミングを独学で学ぶ

    • 先のPepper社会貢献プログラムをきっかけに、プログラミングに興味を持ち、独学で学び始める
    • コロナ禍で時間を持ち余していたので、Pythonを始め、Java、Web開発(HTML/CSS/JavaScript/PHP/jQuery)、SQL、Kotlinと幅広く言語を学ぶ
    • AIの無い、QiitaやStack Overflow、Google検索や試行錯誤で時間をかける古き良き(?)時代のプログラミングを経験できたのは、基礎力の面で今でも役立っている
  3. 所属・活動開発

    名古屋工業大学 入学

  4. アルバイト

    学習塾アルバイト

  5. アルバイト

    学習塾アルバイト

  6. 所属・活動開発

    第61回工大祭 2023 Webサイト開発

    UI/UX改善を担当
    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    Next.jsTypeScriptSCSSGitHub Actions
    • 工大祭実行委員会のWeb担当として、サイトの更新と運用を担当
    • UI/UX改善を目標に、デザインを1から再構築
  7. アルバイト開発

    名古屋工業大学 技術補佐員

    熱中症搬送者数予測サイトの開発・運用
    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    Node.jsTypeScriptFirebaseGoogle Cloud
    • 研究成果の社会実装として「熱中症搬送者数予測サイト」の開発・運用に参画し、教授の要望ヒアリング~要件整理~設計~実装まで一連を担当
    • ユーザーが見やすいUI、グラフ機能や通知機能などの継続的に利用しやすい機能の追加
    • データ収集や計算処理、表示などのバックエンドの自動化などの運用方法の設計、実装
  8. 所属・活動開発

    第62回工大祭 2024 Webサイト開発

    継続開発しやすい環境整備を担当
    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    Next.jsTypeScriptSCSSGitHub Actions
    • 今後何年にもわたって継続開発しやすい環境へ刷新を目標に、HTML/CSS/JavaScriptからNext.js/TypeScript/SCSSへ移行
    • コンポーネント化により、ページ追加・改修の作業コストを下げる設計に改善
    • CI導入, ドキュメント整備, GitHubでのバージョン管理など、長期的に利用できる開発環境を整備
  9. インターン開発

    Qiita株式会社 / 株式会社エイチームホールディングス

    就業型サマーインターンシップ
    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    ReactTypeScriptRailsDocker
    • 就業型インターンとして実プロダクトの課題(インターン向け生issue)を複数実装し、フロント/バック両方の改修を経験
    • PR作成, レビュー対応, ドキュメントの残し方など、チーム開発の基本を実務の中で習得
  10. コンペ

    ICPC(国際大学対抗プログラミングコンテスト) 2024 国内予選 - 国内94位, 大学内1位

    青色・茶色(当時)の友人と参加しました
  11. インターン開発

    株式会社アイスタイル

    就業型サマーインターンシップ
    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    PHPLaravelJavaSpring Boot
    • 既存コードのPHPの調査・仕様把握を行い、Java(Spring Boot)への移行作業を担当
    • 既存挙動を崩さないことを重視して段階的に置き換え
    • 移行対象機能の利用箇所やDB処理、テストケースの洗い出し、移行直前の動作確認までを一貫して実施
  12. ハッカソン開発

    JPHACKS 2024

    位置情報を使ったリアルタイムチャットWebアプリ"What's Up!"を開発
    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    Node.jsTypeScriptsocket.io
    • 短期間のチーム開発で、役割分担, 仕様決め, デモまで完走
    • 位置情報を使って近距離ユーザー同士を自動でグルーピングし、リアルタイムチャットできるWebアプリを開発
    • 短期間開発のためMVP実装を意識した仕様決め
  13. 所属・活動

    Efrei Paris大学 フランス留学

    大学の情報工学科の交換留学生として、フランスのパリにあるEfrei Paris大学に留学
    • フランス語, Web Development, Project Managementなどを学習
    • 今でも当時出会った学生と日本で遊ぶことも(1, 2か月に一度ほど数日間)
    • 現地でビリヤードにハマる
    • 路面電車でピックポケットと口論をする(友人がスマホを取られかけたのを防いだため)
    • 満潮で友人と島に取り残されかける(ギリギリ生還)
  14. 所属・活動

    名古屋工業大学 玉木・丁研究室 配属

    • 研究室の研究テーマ: Computer Vision
    • 自分の研究テーマ: 動画生成(Diffusion Model)
    • 研究以外にもAIや新しいツール、研究効率改善方法の取り入れと普及に個人的に・研究室全体として積極的に取り組む
    • サーバー係として研究室のサーバー・GPUの管理・整備・導入を担当
  15. インターン開発

    株式会社イノベーション

    就業型長期インターンシップ
    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    ReactPHPLaravelDocker
    • 新規事業に参画し、要件定義~DB設計~実装~リリースまでを一貫して担当
    • MVPとして作られたDB/プロダクトに対して、要件追加・継続的な運用を踏まえた改善を継続的に実施
    • DB設計の見直し、既存データとの整合性を保つためのマイグレーション設計、保守性を意識したリファクタリングなど
  16. 研究

    国内学会: 画像の認識・理解シンポジウム (MIRU 2025)

    M3DDMによるvideo outpainting結果の改善方法の検討
  17. 研究

    国際学会: The International Workshop on Advanced Image Technology (IWAIT 2026)

    M3DDM+: an improved video outpainting by a modified masking strategy
  18. 所属・活動

    名古屋CVPR・ML勉強会 運営

  19. コンペ

    株式会社サイバーエージェント主催 AI Agent Challenge - 2位

    • AIコーディング力を競うコンペティションで2位
    • 僅差で優勝を逃してしまったが、AIコーディングの可能性を実感
    • 社内イベントのAI Fes. 2026に参加
  20. ハッカソン開発

    第4回 Agentic AI Hackathon with Google Cloud

    論文サーベイ効率化ツール「RAPID Agent」を開発
    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    Next.jsTypeScriptPythonGoogle CloudVertex AIEmbedding
    • 年間6500本超のCVF Open Access上のCV論文をEmbedding検索により高速に「探す・仕分け」を行うツール。
    • Frontend(Next.js) + Backend(Flask) + Google Cloud(Vertex AI, Cloud Run)の構成
  21. ハッカソン開発

    Google Developer Groups on Campus Japan Hackathon 2026 - AI賞 受賞

    「説明する」を通じて理解を深める学習チャット「パピる」を開発
    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    ReactTypeScriptGoGoogle CloudVertex AITerraform
    • AIに聞いてばかりが増える近年、AIに質問してもらい、説明することで本当の理解を深めることができる学習チャットを開発
    • チャット履歴をツリービューで表示することによる情報の整理と、AIのコード生成による理解のビジュアライズ(Generative UI)によって通常のAIチャットではできない理解の可視化を実現
    • AI賞(最もAI技術を深く理解していると審査員全員が判断したプロダクト)を受賞
  22. 所属・活動

    名古屋工業大学 卒業

  23. 所属・活動

    名古屋工業大学大学院 入学

    • 学業成績(GPA)で推薦をもらい、同大学大学院に入学
  24. インターン

    株式会社GA technologies

    「本選考直結」1dayインターン〜GIANT LEAP for TECH〜
    Ruby
    • 「良いコードとは」をテーマに、グループディスカッションに参加
    • 会社説明・オフィスツアーで会社について詳しく知る
  25. インターン開発

    株式会社ジーニー

    春季インターンシップ
    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    ReactGo
    • CS向けWebシステムの改善・新機能開発をテーマに、リファクタリングから機能実装まで担当
    • フロント・バック両側での実装を通じて、B2Bプロダクト開発におけるビジネス視点を実感
  26. 所属・活動

    クラウドネイティブ会議 | more than coffee

    クラウドネイティブ会議で、TECH WORLDさんの「more than coffee」にてコーヒーを提供☕
  27. コンペ研究

    1st Cross-Domain EgoCross Challenge (Open-source Track) @ EgoVis Workshop, CVPR 2026 - 3位入賞

    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    PythonFine-tuningLoRAVLMVertex AIContext CachingIn-context learning
    • Video QAタスクにおいて、VLMの精度を競うコンペティションに参加
    • In-context learningと提案手法の工夫によって、ベースラインから大幅に精度を向上
    • 期間終盤は常に1位をキープしていたが、残り時間15分に1%差で逆転されてしまうという大接戦を繰り広げ、最終的に3位入賞
    • Qwen-3-VLのLoRAを用いたファインチューニングやVertex AIのContext Cachingなども経験
  28. 進行中開発

    ML職種に対する理解

    Frontend
    Backend
    Infra
    ML Ops
    ML Research
    • MLOps勉強会への参加
    • MLOps技術書を読む
    • MLコンペ(Kaggleなど)に参加
  29. インターン開発

    サマーインターン

    複数社参加予定
  30. 目標

    卒研

    研究で納得のいく結果を出す。学会で発表・議論する。
  31. 目標

    資格取得

    AWS CLF, SAA
  32. 目標

    Qiita

    記事を3本以上投稿する
  33. 目標

    将来の進路を決める

  34. 所属・活動

    名古屋工業大学大学院 卒業予定

Publications

Papers

2026/5

Reflective Dialogue between Teacher and Solver Agents for Video Question Answering

Takuya Murakawa, Toru Tamaki

arXiv preprint / Technical report for 1st Cross-Domain EgoCross Challenge @ EgoVis Workshop, CVPR 2026

Various approaches have been proposed to adapt Vision-Language Models (VLMs) to specialized domains for Video Question Answering, including fine-tuning and in-context learning. However, acquiring task-specific knowledge at the inference phase from only a small labeled support set without fine-tuning remains a challenge. In this paper, we propose a method that achieves adaptation solely through inference-time context injection. Our method first constructs a Reflective Dialogue (RD) -- a multi-turn conversation between two agents, in which Teacher poses each support question and delivers correctness feedback, and Solver answers and provides visual grounding explanations (or reflections) for both correct and incorrect answers. This dialogue history is then used as context at the inference phase. Experiments on the EgoCross benchmark demonstrate that our method outperforms both a baseline zero-shot setting and a standard in-context learning approach that passes support set examples directly, achieving 3rd place in the Open-source Track of the 1st Cross-Domain EgoCross Challenge at the CVPR 2026 EgoVis Workshop, for which this paper also serves as a technical report.
2026/1

M3DDM+: an improved video outpainting by a modified masking strategy

Takuya Murakawa, Takumi Fukuzawa, Ding Ning, Toru Tamaki

IWAIT 2026 Poster Session

M3DDM provides a computationally efficient framework for video outpainting via latent diffusion modeling. However, it exhibits significant quality degradation --- manifested as spatial blur and temporal inconsistency --- under challenging scenarios characterized by limited camera motion or large outpainting regions, where inter-frame information is limited. We identify the cause as a training-inference mismatch in the masking strategy: M3DDM's training applies random mask directions and widths across frames, whereas inference requires consistent directional outpainting throughout the video. To address this, we propose M3DDM+, which applies uniform mask direction and width across all frames during training, followed by fine-tuning of the pretrained M3DDM model. Experiments demonstrate that M3DDM+ substantially improves visual fidelity and temporal coherence in information-limited scenarios while maintaining computational efficiency. The code is available at https://github.com/tamaki-lab/M3DDM-Plus.
2025/7

M3DDMによるvideo outpainting結果の改善方法の検討

村川卓也, 丁寧, 玉木徹

MIRU 2025 Poster Session

2026/5

Reflective Dialogue between Teacher and Solver Agents for Video Question Answering

Takuya Murakawa, Toru Tamaki

arXiv preprint / Technical report for 1st Cross-Domain EgoCross Challenge @ EgoVis Workshop, CVPR 2026

Various approaches have been proposed to adapt Vision-Language Models (VLMs) to specialized domains for Video Question Answering, including fine-tuning and in-context learning. However, acquiring task-specific knowledge at the inference phase from only a small labeled support set without fine-tuning remains a challenge. In this paper, we propose a method that achieves adaptation solely through inference-time context injection. Our method first constructs a Reflective Dialogue (RD) -- a multi-turn conversation between two agents, in which Teacher poses each support question and delivers correctness feedback, and Solver answers and provides visual grounding explanations (or reflections) for both correct and incorrect answers. This dialogue history is then used as context at the inference phase. Experiments on the EgoCross benchmark demonstrate that our method outperforms both a baseline zero-shot setting and a standard in-context learning approach that passes support set examples directly, achieving 3rd place in the Open-source Track of the 1st Cross-Domain EgoCross Challenge at the CVPR 2026 EgoVis Workshop, for which this paper also serves as a technical report.
2026/1

M3DDM+: an improved video outpainting by a modified masking strategy

Takuya Murakawa, Takumi Fukuzawa, Ding Ning, Toru Tamaki

IWAIT 2026 Poster Session

M3DDM provides a computationally efficient framework for video outpainting via latent diffusion modeling. However, it exhibits significant quality degradation --- manifested as spatial blur and temporal inconsistency --- under challenging scenarios characterized by limited camera motion or large outpainting regions, where inter-frame information is limited. We identify the cause as a training-inference mismatch in the masking strategy: M3DDM's training applies random mask directions and widths across frames, whereas inference requires consistent directional outpainting throughout the video. To address this, we propose M3DDM+, which applies uniform mask direction and width across all frames during training, followed by fine-tuning of the pretrained M3DDM model. Experiments demonstrate that M3DDM+ substantially improves visual fidelity and temporal coherence in information-limited scenarios while maintaining computational efficiency. The code is available at https://github.com/tamaki-lab/M3DDM-Plus.
2025/7

M3DDMによるvideo outpainting結果の改善方法の検討

村川卓也, 丁寧, 玉木徹

MIRU 2025 Poster Session

Projects

M3DDM+: An improved video outpainting by a modified masking strategy

国際学会 IWAIT 2026
Frontend
Backend
Infra
ML Ops
ML Research
Research
Video Generation
AI
PyTorch

B4の4月から7月にかけて行った、Video Outpaintingタスクにおける従来手法の改善を目的とした研究で、軽量で高品質な生成を実現しました。MIRU 2025とIWAIT 2026で発表しました。

Reflective Dialogue between Teacher and Solver Agents for Video Question Answering

1st Cross-Domain EgoCross Challenge (Open-source Track) @ EgoVis Workshop, CVPR 2026 | 3位入賞
Frontend
Backend
Infra
ML Ops
ML Research
Research
VLM
Video QA
In-context Learning
Python

Video QAタスクにおけるVLMの性能向上を目的に、In-Context Learningを拡張した手法を提案。学習データを解いた際の振り返り(Reflective Dialogue)を入力に含めることで、パラメータ更新なしに性能を向上させることを実現。EgoCross Challengeで3位入賞。

パピる

Google Developer Groups on Campus Japan Hackathon 2026 | AI賞
Frontend
Backend
Infra
ML Ops
ML Research
React
TypeScript
Go
Google Cloud
Vertex AI
Terraform

「説明する」を通じて理解を深める学習チャット。Google Developer Groups on Campus Japan Hackathon 2026でAI賞(最もAI技術を深く理解していると審査員全員が判断したプロダクト)を受賞。

RAPID Agent

第4回 Agentic AI Hackathon with Google Cloud
Frontend
Backend
Infra
ML Ops
ML Research
Next.js
TypeScript
Python
Google Cloud
Vertex AI
Embedding
Drizzle ORM

年間6500本超のCV論文をEmbedding検索で「探す・仕分け」を高速化するツール。第4回 Agentic AI Hackathon with Google Cloudで開発。

第62回工大祭 2024

Frontend
Backend
Infra
ML Ops
ML Research
チーム開発
Next.js
TypeScript
CI/CD

第61回工大祭 2023

Frontend
Backend
Infra
ML Ops
ML Research
デザイン改修
HTML
CSS
JavaScript

熱中症搬送者数予測サイト

Frontend
Backend
Infra
ML Ops
ML Research
チーム開発
TypeScript
Firebase

TODO REAL

Frontend
Backend
Infra
ML Ops
ML Research
Next.js
TypeScript
Firebase
Google Cloud

Visualize-GeoJSON-with-Three-js

Frontend
Backend
Infra
ML Ops
ML Research
Next.js
TypeScript
Three.js

What's Up!

JPHACKS 2024
Frontend
Backend
Infra
ML Ops
ML Research
Next.js
TypeScript
socket.io

Articles

Loading...

Slides

Video2LoRA: Unified Semantic-Controlled Video Generation via Per-Reference-Video LoRA & Zero-Shot Dynamic Concept Personalization with Grid-Based LoRA

MotionMatcher: Cinematic Motion Customizationof Text-to-Video Diffusion Models via Motion Feature Matching

CVPR2025論文紹介:「Unboxed: Geometrically and Temporally Consistent Video Outpainting」

What, when, and where? Self-Supervised Spatio-Temporal Grounding in Untrimmed Multi-Action Videos from Narrated Instructions

Stats

GitHub

avg — / active day

Coding History

avg — / active day

AI Coding Usage

AtCoder

Current Rating
Highest Rating
Contests

Connpass

運営
登壇
参加

Qiita

記事数
いいね
保存数
閲覧数

AI Tools

ClaudeClaude CodeCopilot ProGemini AI ProCursorAntigravity

Recent Interests

AI AgentLocal LLMOpen Weight LLMVLM