Murakawa Takuya

Fullstack Development×Computer Vision Research

Bio

スケジュールはいつもギチギチです。忙しい時期には1日15時間作業します。新しいものを試したり、便利なものを取り入れるのが好きです。
フルスタックweb開発とコンピュータビジョン系の研究を主とし、研究室のサーバー・GPUの整備やコンピュータビジョン系の勉強会の幹事など幅広く活動しています。

Motto

“The only place where success comes before work is in the dictionary.”
「努力」の前に「成功」が来るのは辞書の中だけ。

Strengths

挑戦心

キャッチアップ力

スピード感

継続力

Qualifications

応用情報技術者試験

TOEIC LR 895点

実用英語技能検定準一級

Skills

Web Full Stack

End-to-end web application development

FrontendBackendInfrastructure

Computer Vision Research

ML research & deep learning models

Machine LearningCV ResearchDiffusion

Server / GPU Management

Research infrastructure

CUDALinux

Timeline

2018/12
2018/12
ハッカソン開発
ソフトバンクグループ株式会社主催 Pepper社会貢献プログラム中学生部門 - 市内優勝 / 全国大会出場
•市がソフトバンクグループと提携し、技術の授業でペッパー君のプログラミングを行う
•中学生部門において市内で最優秀作品に選出
•全国トップ10の作品に選出され、全国大会に出場
•薬の飲み忘れや飲み間違いなどの事故を防ぐための『薬服用確認プログラム』を開発
View Link
2019~2021
2019~2021
所属・活動開発
プログラミングを独学で学ぶ
•先のPepper社会貢献プログラムをきっかけに、プログラミングに興味を持ち、独学で学び始める
•コロナ禍で時間を持ち余していたので、Pythonを始め、Java、Web開発(HTML/CSS/JavaScript/PHP/jQuery)、SQL、Kotlinと幅広く言語を学ぶ
•AIの無い、QiitaやStack Overflow、Google検索や試行錯誤で時間をかける古き良き(?)時代のプログラミングを経験できたのは、基礎力の面で今でも役立っている
2022/4
2022/4
所属・活動開発
名古屋工業大学入学
2022/4 ~ 2024/3
2022/4 ~ 2024/3
アルバイト
学習塾アルバイト
2022/10 ~ 2023/2
2022/10 ~ 2023/2
アルバイト
学習塾アルバイト
2023/1 ~ 2023/11
2023/1 ~ 2023/11
所属・活動開発
第61回工大祭 2023 Webサイト開発
UI/UX改善を担当
Frontend
Backend
Infra
ML Ops
ML Research
Next.jsTypeScriptSCSSGitHub Actions
•工大祭実行委員会のWeb担当として、サイトの更新と運用を担当
•UI/UX改善を目標に、デザインを1から再構築
View Link
2023/12 ~ 2025/7
2023/12 ~ 2025/7
アルバイト開発
名古屋工業大学技術補佐員
熱中症搬送者数予測サイトの開発・運用
Frontend
Backend
Infra
ML Ops
ML Research
Node.jsTypeScriptFirebaseGoogle Cloud
•研究成果の社会実装として「熱中症搬送者数予測サイト」の開発・運用に参画し、教授の要望ヒアリング~要件整理~設計~実装まで一連を担当
•ユーザーが見やすいUI、グラフ機能や通知機能などの継続的に利用しやすい機能の追加
•データ収集や計算処理、表示などのバックエンドの自動化などの運用方法の設計、実装
View Link
2024/1 ~ 2024/12
2024/1 ~ 2024/12
所属・活動開発
第62回工大祭 2024 Webサイト開発
継続開発しやすい環境整備を担当
Frontend
Backend
Infra
ML Ops
ML Research
Next.jsTypeScriptSCSSGitHub Actions
•今後何年にもわたって継続開発しやすい環境へ刷新を目標に、HTML/CSS/JavaScriptからNext.js/TypeScript/SCSSへ移行
•コンポーネント化により、ページ追加・改修の作業コストを下げる設計に改善
•CI導入, ドキュメント整備, GitHubでのバージョン管理など、長期的に利用できる開発環境を整備
View Link
2024/6 ~ 2024/7
2024/6 ~ 2024/7
インターン開発
Qiita株式会社 / 株式会社エイチームホールディングス
就業型サマーインターンシップ
Frontend
Backend
Infra
ML Ops
ML Research
ReactTypeScriptRailsDocker
•就業型インターンとして実プロダクトの課題(インターン向け生issue)を複数実装し、フロント/バック両方の改修を経験
•PR作成, レビュー対応, ドキュメントの残し方など、チーム開発の基本を実務の中で習得
View Link
2024/7
2024/7
コンペ
ICPC(国際大学対抗プログラミングコンテスト) 2024 国内予選 - 国内94位, 大学内1位
青色・茶色（当時）の友人と参加しました
2024/9
2024/9
インターン開発
株式会社アイスタイル
就業型サマーインターンシップ
Frontend
Backend
Infra
ML Ops
ML Research
PHPLaravelJavaSpring Boot
•既存コードのPHPの調査・仕様把握を行い、Java(Spring Boot)への移行作業を担当
•既存挙動を崩さないことを重視して段階的に置き換え
•移行対象機能の利用箇所やDB処理、テストケースの洗い出し、移行直前の動作確認までを一貫して実施
2024/11
2024/11
ハッカソン開発
JPHACKS 2024
位置情報を使ったリアルタイムチャットWebアプリ"What's Up!"を開発
Frontend
Backend
Infra
ML Ops
ML Research
Node.jsTypeScriptsocket.io
•短期間のチーム開発で、役割分担, 仕様決め, デモまで完走
•位置情報を使って近距離ユーザー同士を自動でグルーピングし、リアルタイムチャットできるWebアプリを開発
•短期間開発のためMVP実装を意識した仕様決め
View Link
2025/2 ~ 2025/3
2025/2 ~ 2025/3
所属・活動
Efrei Paris大学フランス留学
大学の情報工学科の交換留学生として、フランスのパリにあるEfrei Paris大学に留学
•フランス語, Web Development, Project Managementなどを学習
•今でも当時出会った学生と日本で遊ぶことも(1, 2か月に一度ほど数日間)
•現地でビリヤードにハマる
•路面電車でピックポケットと口論をする(友人がスマホを取られかけたのを防いだため)
•満潮で友人と島に取り残されかける(ギリギリ生還)
2025/3
2025/3
所属・活動
名古屋工業大学玉木・丁研究室配属
•研究室の研究テーマ: Computer Vision
•自分の研究テーマ: 動画生成(Diffusion Model)
•研究以外にもAIや新しいツール、研究効率改善方法の取り入れと普及に個人的に・研究室全体として積極的に取り組む
•サーバー係として研究室のサーバー・GPUの管理・整備・導入を担当
2025/7 ~ 2026/3
2025/7 ~ 2026/3
インターン開発
株式会社イノベーション
就業型長期インターンシップ
Frontend
Backend
Infra
ML Ops
ML Research
ReactPHPLaravelDocker
•新規事業に参画し、要件定義~DB設計~実装~リリースまでを一貫して担当
•MVPとして作られたDB/プロダクトに対して、要件追加・継続的な運用を踏まえた改善を継続的に実施
•DB設計の見直し、既存データとの整合性を保つためのマイグレーション設計、保守性を意識したリファクタリングなど
2025/7
2025/7
研究
国内学会: 第28回画像の認識・理解シンポジウム (MIRU 2025)
M3DDMによるvideo outpainting結果の改善方法の検討
2026/1
2026/1
研究
国際学会: The 29th The International Workshop on Advanced Image Technology (IWAIT 2026)
M3DDM+: an improved video outpainting by a modified masking strategy
View Link
2026 ~ Present
2026 ~ Present
所属・活動
名古屋CVPR・ML勉強会運営
View Link
2026/2
2026/2
コンペ
株式会社サイバーエージェント主催 AI Agent Challenge - 2位
•AIコーディング力を競うコンペティションで2位
•僅差で優勝を逃してしまったが、AIコーディングの可能性を実感
•社内イベントのAI Fes. 2026に参加
View Link
2026/2
2026/2
ハッカソン開発
第4回 Agentic AI Hackathon with Google Cloud
論文サーベイ効率化ツール「RAPID Agent」を開発
Frontend
Backend
Infra
ML Ops
ML Research
Next.jsTypeScriptPythonGoogle CloudVertex AIEmbedding
•年間6500本超のCVF Open Access上のCV論文をEmbedding検索により高速に「探す・仕分け」を行うツール。
•Frontend(Next.js) + Backend(Flask) + Google Cloud(Vertex AI, Cloud Run)の構成
View Link
2026/3
2026/3
ハッカソン開発
Google Developer Groups on Campus Japan Hackathon 2026 - AI賞受賞
「説明する」を通じて理解を深める学習チャット「パピる」を開発
Frontend
Backend
Infra
ML Ops
ML Research
ReactTypeScriptGoGoogle CloudVertex AITerraform
•AIに聞いてばかりが増える近年、AIに質問してもらい、説明することで本当の理解を深めることができる学習チャットを開発
•チャット履歴をツリービューで表示することによる情報の整理と、AIのコード生成による理解のビジュアライズ(Generative UI)によって通常のAIチャットではできない理解の可視化を実現
•AI賞（最もAI技術を深く理解していると審査員全員が判断したプロダクト）を受賞
View Link
2026/3
2026/3
所属・活動
名古屋工業大学卒業
2026/4
2026/4
所属・活動
名古屋工業大学大学院入学
•学業成績(GPA)で推薦をもらい、同大学大学院に入学
2026/4
2026/4
インターン
株式会社GA technologies
「本選考直結」1dayインターン〜GIANT LEAP for TECH〜
Ruby
•「良いコードとは」をテーマに、グループディスカッションに参加
•会社説明・オフィスツアーで会社について詳しく知る
2026/4
2026/4
インターン開発
株式会社ジーニー
春季インターンシップ
Frontend
Backend
Infra
ML Ops
ML Research
ReactGo
•CS向けWebシステムの改善・新機能開発をテーマに、リファクタリングから機能実装まで担当
•フロント・バック両側での実装を通じて、B2Bプロダクト開発におけるビジネス視点を実感
2026/5
2026/5
所属・活動
クラウドネイティブ会議 | more than coffee
クラウドネイティブ会議で、TECH WORLDさんの「more than coffee」にてコーヒーを提供☕
View Link
2026/5
2026/5
コンペ研究
1st Cross-Domain EgoCross Challenge (Open-source Track) @ EgoVis Workshop, CVPR 2026 - 3位入賞
Frontend
Backend
Infra
ML Ops
ML Research
PythonFine-tuningLoRAVLMVertex AIContext CachingIn-context learning
•Video QAタスクにおいて、VLMの精度を競うコンペティションに参加
•In-context learningと提案手法の工夫によって、ベースラインから大幅に精度を向上
•期間終盤は常に1位をキープしていたが、残り時間15分に1%差で逆転されてしまうという大接戦を繰り広げ、最終的に3位入賞
•Qwen-3-VLのLoRAを用いたファインチューニングやVertex AIのContext Cachingなども経験
View Link
2026/6
2026/6
研究
国内学会: 第32回画像センシングシンポジウム (SSII 2026)
CLIP重みに基づくLoRA合成を用いたゼロショット動作の動画生成
進行中開発
ML職種に対する理解
Frontend
Backend
Infra
ML Ops
ML Research
•MLOps勉強会への参加
•MLOps技術書を読む
•MLコンペ(Kaggleなど)に参加
2026
2026
インターン開発
サマーインターン
複数社参加予定
2026
2026
目標
資格取得
AWS CLF, SAA
2026
2026
目標
MLコンペの参加
Kaggleに参加, 上位を取る
2026
2026
目標
将来の進路を決める
2028/3
2028/3
所属・活動
名古屋工業大学大学院卒業予定

Publications

Papers

2026/6

CLIP重みに基づくLoRA合成を用いたゼロショット動作の動画生成

村川卓也, 福沢匠, 丁寧, 玉木徹

SSII 2026 Poster Session

2026/5

Reflective Dialogue between Teacher and Solver Agents for Video Question Answering

Takuya Murakawa, Toru Tamaki

arXiv preprint / Technical report for 1st Cross-Domain EgoCross Challenge @ EgoVis Workshop, CVPR 2026

Various approaches have been proposed to adapt Vision-Language Models (VLMs) to specialized domains for Video Question Answering, including fine-tuning and in-context learning. However, acquiring task-specific knowledge at the inference phase from only a small labeled support set without fine-tuning remains a challenge. In this paper, we propose a method that achieves adaptation solely through inference-time context injection. Our method first constructs a Reflective Dialogue (RD) -- a multi-turn conversation between two agents, in which Teacher poses each support question and delivers correctness feedback, and Solver answers and provides visual grounding explanations (or reflections) for both correct and incorrect answers. This dialogue history is then used as context at the inference phase. Experiments on the EgoCross benchmark demonstrate that our method outperforms both a baseline zero-shot setting and a standard in-context learning approach that passes support set examples directly, achieving 3rd place in the Open-source Track of the 1st Cross-Domain EgoCross Challenge at the CVPR 2026 EgoVis Workshop, for which this paper also serves as a technical report.

arXiv GitHub Workshop Challenge

2026/1

M3DDM+: an improved video outpainting by a modified masking strategy

Takuya Murakawa, Takumi Fukuzawa, Ding Ning, Toru Tamaki

IWAIT 2026 Poster Session

M3DDM provides a computationally efficient framework for video outpainting via latent diffusion modeling. However, it exhibits significant quality degradation --- manifested as spatial blur and temporal inconsistency --- under challenging scenarios characterized by limited camera motion or large outpainting regions, where inter-frame information is limited. We identify the cause as a training-inference mismatch in the masking strategy: M3DDM's training applies random mask directions and widths across frames, whereas inference requires consistent directional outpainting throughout the video. To address this, we propose M3DDM+, which applies uniform mask direction and width across all frames during training, followed by fine-tuning of the pretrained M3DDM model. Experiments demonstrate that M3DDM+ substantially improves visual fidelity and temporal coherence in information-limited scenarios while maintaining computational efficiency. The code is available at https://github.com/tamaki-lab/M3DDM-Plus.

arXiv Proceedings Project Page GitHub Hugging Face

2025/7

M3DDMによるvideo outpainting結果の改善方法の検討

村川卓也, 丁寧, 玉木徹

MIRU 2025 Poster Session

Poster

2026/6

CLIP重みに基づくLoRA合成を用いたゼロショット動作の動画生成

村川卓也, 福沢匠, 丁寧, 玉木徹

SSII 2026 Poster Session

2026/5

Reflective Dialogue between Teacher and Solver Agents for Video Question Answering

Takuya Murakawa, Toru Tamaki

arXiv preprint / Technical report for 1st Cross-Domain EgoCross Challenge @ EgoVis Workshop, CVPR 2026

arXiv GitHub Workshop Challenge

2026/1

M3DDM+: an improved video outpainting by a modified masking strategy

Takuya Murakawa, Takumi Fukuzawa, Ding Ning, Toru Tamaki

IWAIT 2026 Poster Session

arXiv Proceedings Project Page GitHub Hugging Face

2025/7

M3DDMによるvideo outpainting結果の改善方法の検討

村川卓也, 丁寧, 玉木徹

MIRU 2025 Poster Session

Poster

Projects

M3DDM+: An improved video outpainting by a modified masking strategy

国際学会 IWAIT 2026

Frontend

Backend

Infra

ML Ops

ML Research

Research

Video Generation

PyTorch

B4の4月から7月にかけて行った、Video Outpaintingタスクにおける従来手法の改善を目的とした研究で、軽量で高品質な生成を実現しました。MIRU 2025とIWAIT 2026で発表しました。

GitHub Project Page arXiv Proceedings Hugging Face

Reflective Dialogue between Teacher and Solver Agents for Video Question Answering

1st Cross-Domain EgoCross Challenge (Open-source Track) @ EgoVis Workshop, CVPR 2026 | 3位入賞

Frontend

Backend

Infra

ML Ops

ML Research

Research

VLM

Video QA

In-context Learning

Python

Video QAタスクにおけるVLMの性能向上を目的に、In-Context Learningを拡張した手法を提案。学習データを解いた際の振り返り(Reflective Dialogue)を入力に含めることで、パラメータ更新なしに性能を向上させることを実現。EgoCross Challengeで3位入賞。

arXiv GitHub Workshop Challenge

パピる

Google Developer Groups on Campus Japan Hackathon 2026 | AI賞

Frontend

Backend

Infra

ML Ops

ML Research

React

TypeScript

Google Cloud

Vertex AI

Terraform

「説明する」を通じて理解を深める学習チャット。Google Developer Groups on Campus Japan Hackathon 2026でAI賞（最もAI技術を深く理解していると審査員全員が判断したプロダクト）を受賞。

GitHub Demo

RAPID Agent

第4回 Agentic AI Hackathon with Google Cloud

Frontend

Backend

Infra

ML Ops

ML Research

Next.js

TypeScript

Python

Google Cloud

Vertex AI

Embedding

Drizzle ORM

年間6500本超のCV論文をEmbedding検索で「探す・仕分け」を高速化するツール。第4回 Agentic AI Hackathon with Google Cloudで開発。

GitHub Demo Zenn

第62回工大祭 2024

Frontend

Backend

Infra

ML Ops

ML Research

チーム開発

Next.js

TypeScript

CI/CD

GitHub Website

第61回工大祭 2023

Frontend

Backend

Infra

ML Ops

ML Research

デザイン改修

HTML

CSS

JavaScript

GitHub Website

熱中症搬送者数予測サイト

Frontend

Backend

Infra

ML Ops

ML Research

チーム開発

TypeScript

Firebase

Website

TODO REAL

Frontend

Backend

Infra

ML Ops

ML Research

Next.js

TypeScript

Firebase

Google Cloud

GitHub Website

Visualize-GeoJSON-with-Three-js

Frontend

Backend

Infra

ML Ops

ML Research

Next.js

TypeScript

Three.js

GitHub Website

What's Up!

JPHACKS 2024

Frontend

Backend

Infra

ML Ops

ML Research

Next.js

TypeScript

socket.io

GitHub

Articles

Slides

Video2LoRA: Unified Semantic-Controlled Video Generation via Per-Reference-Video LoRA & Zero-Shot Dynamic Concept Personalization with Grid-Based LoRA

2026年4月9日@コンピュータビジョン論文読み会2026-1

View Slides

MotionMatcher: Cinematic Motion Customizationof Text-to-Video Diffusion Models via Motion Feature Matching

2025年11月25日@コンピュータビジョン論文読み会2025-14

View Slides

CVPR2025論文紹介：「Unboxed: Geometrically and Temporally Consistent Video Outpainting」

2025年8月9日@第62回名古屋CV・PRML勉強会

View Slides

What, when, and where? Self-Supervised Spatio-Temporal Grounding in Untrimmed Multi-Action Videos from Narrated Instructions

2025年4月22日@コンピュータビジョン論文読み会2025-2

View Slides

Stats

GitHub

avg — / active day

Coding History

avg — / active day

AI Coding Usage

AtCoder

Current Rating—

Highest Rating—

Contests—

Connpass

運営—

登壇—

参加—

Qiita

記事数—

いいね—

保存数—

閲覧数—

AI Tools

ClaudeClaude CodeCodexGemini AI ProCursorAntigravity

Recent Interests

AI AgentLocal LLMOpen Weight LLMVLM

Murakawa Takuya

Skills

Web Full Stack

Computer Vision Research

Server / GPU Management

Frontend

Backend

Infrastructure

Machine Learning

Editor

OS

Tool

Other

Frontend

Backend

Infrastructure

Machine Learning

Editor

OS

Tool

Other

Timeline

ソフトバンクグループ株式会社主催 Pepper社会貢献プログラム 中学生部門 - 市内優勝 / 全国大会出場

プログラミングを独学で学ぶ

名古屋工業大学 入学

学習塾アルバイト

学習塾アルバイト

第61回工大祭 2023 Webサイト開発

名古屋工業大学 技術補佐員

第62回工大祭 2024 Webサイト開発

Qiita株式会社 / 株式会社エイチームホールディングス

ICPC(国際大学対抗プログラミングコンテスト) 2024 国内予選 - 国内94位, 大学内1位

株式会社アイスタイル

JPHACKS 2024

Efrei Paris大学 フランス留学

名古屋工業大学 玉木・丁研究室 配属

株式会社イノベーション

国内学会: 第28回画像の認識・理解シンポジウム (MIRU 2025)

国際学会: The 29th The International Workshop on Advanced Image Technology (IWAIT 2026)

名古屋CVPR・ML勉強会 運営

株式会社サイバーエージェント主催 AI Agent Challenge - 2位

第4回 Agentic AI Hackathon with Google Cloud

Google Developer Groups on Campus Japan Hackathon 2026 - AI賞 受賞

名古屋工業大学 卒業

名古屋工業大学大学院 入学

株式会社GA technologies

株式会社ジーニー

クラウドネイティブ会議 | more than coffee

1st Cross-Domain EgoCross Challenge (Open-source Track) @ EgoVis Workshop, CVPR 2026 - 3位入賞

国内学会: 第32回画像センシングシンポジウム (SSII 2026)

ML職種に対する理解

サマーインターン

資格取得

MLコンペの参加

将来の進路を決める

名古屋工業大学大学院 卒業予定

Publications

Papers

CLIP重みに基づくLoRA合成を用いたゼロショット動作の動画生成

Reflective Dialogue between Teacher and Solver Agents for Video Question Answering

M3DDM+: an improved video outpainting by a modified masking strategy

M3DDMによるvideo outpainting結果の改善方法の検討

CLIP重みに基づくLoRA合成を用いたゼロショット動作の動画生成

Reflective Dialogue between Teacher and Solver Agents for Video Question Answering

M3DDM+: an improved video outpainting by a modified masking strategy

M3DDMによるvideo outpainting結果の改善方法の検討

Projects

M3DDM+: An improved video outpainting by a modified masking strategy

Reflective Dialogue between Teacher and Solver Agents for Video Question Answering

パピる

RAPID Agent

第62回工大祭 2024

第61回工大祭 2023

熱中症搬送者数予測サイト

TODO REAL

Visualize-GeoJSON-with-Three-js

What's Up!

Articles

Slides

Video2LoRA: Unified Semantic-Controlled Video Generation via Per-Reference-Video LoRA & Zero-Shot Dynamic Concept Personalization with Grid-Based LoRA

ソフトバンクグループ株式会社主催 Pepper社会貢献プログラム中学生部門 - 市内優勝 / 全国大会出場

名古屋工業大学入学

名古屋工業大学技術補佐員

Efrei Paris大学フランス留学

名古屋工業大学玉木・丁研究室配属

名古屋CVPR・ML勉強会運営

Google Developer Groups on Campus Japan Hackathon 2026 - AI賞受賞

名古屋工業大学卒業

名古屋工業大学大学院入学

名古屋工業大学大学院卒業予定