PLM関連テクノロジーリファレンス – 私的参照サイト (備忘録)
普段、必要に応じて参照しているあるいは参照した各社サイトについて、私的備忘録をしてリストしました。尚、固有の企業を宣伝するものではありません。
AI LLM データを学習する上で日本語圏と英語圏の格差 (@20251205)
Google AI による概要 By「ai llm データを学習する上で日本語圏と英語圏の格差」
AIのLLM(大規模言語モデル)の学習データにおいて、日本語圏と英語圏にはデータの「量」と「質」の両面で圧倒的な格差が存在します。これにより、英語ベースのモデルの方が一般的に高い推論精度と思考の質を示す傾向があります。
格差の主な要因
-
学習データの「量」の格差:
-
インターネット上のデジタルデータの総量として、英語のデータセットが圧倒的に多く存在します。これは、AI企業がウェブからデータを抽出する際に最も主要な言語となるためです。
-
日本語のデータ量は少なく、これが日本語LLMの性能を制限する大きな要因となっています。
-
-
学習データの「質」の格差:
-
英語圏のデータは、多様な話題や社会経済的背景を反映したものが豊富に集まりやすいです。
-
一方、日本語の学習データは、特定の情報源に偏ったり、機械翻訳されたコンテンツが含まれたりする可能性があり、真正性や文化固有の文脈での性能が制限されることがあります。
-
-
言語特性の違いと「トークン化」の非効率性:
-
LLMはテキストを「トークン」という単位に分割して処理しますが、日本語は英語に比べて情報密度が低いという言語特性があります。また、日本語の複雑な文字体系(漢字、ひらがな、カタカナ)は、トークン化の効率を低下させ、同じ情報量を処理するためにより多くのトークンを必要とすることがあります。これにより、処理コストと計算負荷が増加します。
-
-
研究開発のリソースと文化的な偏り:
-
多くの主要なLLMは、まず英語を主要言語として開発され、英語圏の文化的背景や考え方(RLHFにおけるバイアス)を強く反映して設計される傾向があります。
-
英語以外の言語では、ローカルなデータを用いた追加学習や、言語固有の研究開発リソースが不足しがちです。
-
結果としての影響
これらの格差により、グローバルモデルの日本語での応答は、情報不足による「知識の抜け落ち」や「誤った補完(ハルシネーション)」が発生しやすくなります。一方で、日本の研究機関や企業は、日本語の特性に合わせた独自のモデル(例: Swallow)や効率的なトークナイザーを開発し、この格差を埋める努力を続けています。
Google Search – 一般サイト参照
-
no+e:
日本語と英語、LLMの「思考の質」に横たわる見えざる壁とは? あなたも感じた「あの違和感」の正体 (20250512) => https://note.com/sakamototakuma/n/n78e6a4541c89
【徹底解説】LLMはなぜ英語が得意なのか?言語の壁とAIの性能差について (20250203) => https://note.com/genesisstudio/n/nfde6830d2ae5
AIは本当に賢いのか?283種類のLLM評価基準から見えた測定の限界と盲点 (20250824) => https://note.com/rami_engineer/n/ndd1e4ad8935d -
Learning Cycle Collective: Global Voices on DEI:英語の一人勝ちを許すな!AI技術で守る言語の多様性 (20240702) => https://blog-jp.learningcycle.co/2024/07/02/using-the-power-of-ai-to-protect-linguistic-diversity/
-
松尾研究所テックブログ:日本語医療特化型LLMの現状と展望 (20250623) => https://zenn.dev/mkj/articles/b04bdede9bc3d6
-
harBest:日本語LLM開発のための日本語データセットの重要性について解説!(20250617) => https://harbest.io/documents/885/
-
言語処理学会:LLM は日本語追加学習により言語間知識転移を起こすのか? (202403) => https://www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/P10-9.pdf
Google AI による概要 By 「ai llm disparity between japanese speaking area and english speaking area abput learning data」
There is a significant disparity in Large Language Model (LLM) performance and development between English-speaking and Japanese-speaking areas, primarily due to the vast imbalance in the volume and quality of available training data. English has a much larger digital footprint, resulting in more robust, culturally attuned AI models, while Japanese faces challenges inherent to a “low-resource” language in the context of global AI development.
Key Disparities
-
Data Volume and Quality: English text makes up a disproportionately large percentage of the internet data used to train major LLMs (around 44% of datasets like Common Crawl), whereas Japanese accounts for a much smaller fraction (around 4.9%). This abundance of English data ensures a richer, more diverse, and contextually varied dataset for model training, leading to higher performance.
-
Performance Gaps: General-purpose LLMs perform better in English than in Japanese. Performance disparities manifest in various tasks; models may struggle with linguistic phenomena unique to Japanese, complex reasoning, or domain-specific knowledge queries in Japanese compared to English.
-
Cultural Bias: AI models trained predominantly on English data often embed Western cultural values and assumptions, which may not align with Japanese cultural contexts. This can lead to outputs that are unnatural, culturally inappropriate, or less useful for Japanese users.
-
Linguistic Complexity: Japanese has unique grammatical structures, a high degree of context dependency, and a complex writing system (hiragana, katakana, kanji). These features make developing NLP applications more complex compared to English, which uses a more regular, alphabet-based system.
-
Prompting Efficiency: English has been found to be approximately two times more efficient for prompting current LLMs compared to CJK (Chinese, Japanese, and Korean) languages, meaning users get better results with fewer tokens
Efforts to Bridge the Gap
To address these disparities, researchers and developers in Japan are pursuing several strategies:
-
Local LLMs: There is an increased focus on developing and fine-tuning Japanese-specific LLMs (e.g., the Japanese version of ChatGPT or models like “ELYZA”) using curated Japanese datasets to better capture the nuances of the language and culture.
-
Advanced Techniques: Researchers are exploring techniques such as fine-tuning with limited data (e.g., using Low-Rank Adaptation (LoRA)), transfer learning, and data augmentation to improve performance without needing a massive ground-up corpus.
-
Community-Driven Data Collection: Efforts are underway to create more representative data sets in collaboration with local communities, ensuring data quality, cultural relevance, and addressing data ownership issues.
Overall, while there is a significant data disparity leading to a performance gap, dedicated efforts are being made to develop more equitable and effective AI solutions for Japanese speakers.
Google Search – 一般サイト参照
-
Nature:Large language models are biased — local initiatives are fighting for change (20251127) => https://www.nature.com/articles/d41586-025-03891-y
-
Engelsberg Ideas:Japan’s LLM language barrier (20251118) => https://engelsbergideas.com/essays/japans-llm-language-barrier/
-
HUMAN SCIENCE;Top 3 Recommended Japanese LLMs: A Thorough Comparison of Large-Scale Language Models Specialized for Japan [Latest 2025] (20240826) => https://www.science.co.jp/en/annotation_blog/39133/
-
Reddit:How do you feel about AI and LLM adoption in Japan compared to the West? (6mo ago @20251205) => https://www.reddit.com/r/AskAJapanese/comments/1kyzb30/how_do_you_feel_about_ai_and_llm_adoption_in/
-
Springer Nature Link;Comparing generative AI with native speakers in terms of request expressions in Japanese (2025) => https://link.springer.com/article/10.1007/s44217-025-00920-w
-
ScienceDirect:A comparative study of English and Japanese ChatGPT responses to anaesthesia-related medical questions (2024) => https://www.sciencedirect.com/science/article/pii/S2772609624000406
-
pangeanic:Power the rapid expansion of AI in Japan with high-quality, meticulously curated Japanese datasets, to build accurate and culturally resonant applications. => https://pangeanic.com/japanese-datasets-for-artificial-intelligence-training
-
MDPI:Enhancing Sustainable AI-Driven Language Learning: Location-Based Vocabulary Training for Learners of Japanese (20250216) => https://www.mdpi.com/2071-1050/17/6/2592
-
Medium:The State of Multilingual LLM Safety Research: From Measuring the Language Gap to Mitigating It (20250825) => https://medium.com/@kiplangatkorir/the-state-of-multilingual-llm-safety-research-from-measuring-the-language-gap-to-mitigating-it-0f1fbedc5b80
-
松尾・岩澤研究室:Behind the scenes of LLM research attracting worldwide attention. What is the research environment that generates discussions with top researchers? (20240611) => https://weblab.t.u-tokyo.ac.jp/en/news/20240611/
"デジタルスレッド どのように繋ぐのか?” (@20251130)
Google AI による概要
デジタルスレッドを構築するには、製品のライフサイクル全体に関わるデータを、ITシステムや部署の壁を越えて一元的に連携させるプロセスが必要です。特定の技術を導入するだけでなく、情報共有の仕組みを根本から構築することが重要です。
デジタルスレッドを繋ぐ基本的なステップは、以下の通りです。
1. 接続対象のデータとシステムを特定する
デジタルスレッドの目的は、製品のライフサイクル全体を可視化することです。最初に、どの工程の、どのシステムにある、どのデータを接続すべきかを洗い出します。
-
設計データ: CAD(コンピューター支援設計)ツールで作成された3Dモデル、図面、仕様書など。
-
製造データ: 生産設備やIoTセンサーから収集される稼働データ、製造指示書、品質検査記録など。
-
サプライチェーンデータ: 部品サプライヤー情報、在庫管理、物流追跡データなど。
-
サービス・保守データ: メンテナンス履歴、顧客からのフィードバック、修理記録など。
2. データ連携基盤を構築する
各システムから発生するデータを集約・連携するための基盤を構築します。製品ライフサイクル管理(PLM)システムがこの中核を担うことが多く、PLMが設計情報や製造プロセスを一元管理し、他のシステムと連携します。
-
データの標準化: 各システムで異なる形式のデータを、共通のデータモデルに変換します。
-
API連携: 各システム間のデータ連携にAPI(アプリケーション・プログラミング・インターフェース)を利用します。
-
クラウド活用: 柔軟なデータ連携と拡張性を持たせるため、クラウド環境を活用します。
3. デジタルツインを活用する
デジタルスレッドによって集約されたデータをもとに、現実の製品や設備をデジタル空間に再現した「デジタルツイン」を作成します。デジタルツインは、デジタルスレッドのデータを活用し、シミュレーションや分析を可能にします。
-
デジタルツインの作成: 製品の3DモデルやIoTデータなど、デジタルスレッド上の情報を組み合わせてデジタルツインを構築します。
-
シミュレーションと分析: デジタルツイン上で性能予測や故障シミュレーションを行い、設計改善や製造プロセスの最適化に役立てます。
4. フィードバックループを構築する
デジタルスレッドは一方通行のデータの流れではありません。製品の運用・保守段階で得られたデータを設計部門へフィードバックすることで、製品の改善につなげる「フィードバックループ」が重要です。
-
リアルタイムデータの活用: 顧客からのフィードバックや保守履歴をデジタルスレッドを通じて設計部門に共有します。
-
設計変更への反映: 現場の声を活かした製品改善を迅速に行えるようになります。
5. 組織文化の変革を推進する
部門間の壁を取り払い、全社でデータを共有・活用する文化を醸成します。
-
全社的な意識改革: デジタルスレッドの重要性を浸透させ、全従業員が当事者意識を持ってデータ活用に取り組む環境を整えます。
-
部門横断チームの結成: デジタルスレッドの設計から運用までを担う、部門横断型のチームを設置します。
デジタルスレッドをどのように構築すべきかは、企業の規模や目的によって異なります。まずは、特定の製品ライフサイクルに着目し、小さく始めて徐々に範囲を広げていく方法が効果的です。詳細な導入ステップについては、PTCのデジタルスレッド戦略ブログなども参考にしてください。
Google Search:一般サイト参照
-
IKETEL, Ltd.:
製造業における「デジタルスレッド」を1分解説 => https://www.iketel.co.jp/raction/column/8 -
PTC:
デジタルスレッド: デジタルトランスフォーメーション (DX) を可能にする重要な要素 => https://www.ptc.com/ja/industry-insights/digital-thread
製造業 DX の成功事例に学ぶ:3D モデルと PLM でつながるデジタルスレッド (20250730) => https://www.ptc.com/ja/blogs/cad/accelerating-dx-with-digital-thread
PLM ソフトウェアでデジタルスレッドを実現 => https://www.ptc.com/ja/products/windchill/digital-campaign-jp -
Aras:
自社のデジタルスレッドを構築する => https://aras.com/ja-jp/why-aras/digital-thread
DX戦略とデジタルスレッド (20250205) => https://aras.com/ja-jp/blog/exploring-the-transformation-to-the-digital-enterprise-4-key-takeaways -
SCSK:
デジタルスレッドが設計、製造、調達をどう結び付けるか (20230817) => https://www.scsk.jp/sp/eng-dx/product/apriori/column/digital-thread.html -
コアコンセプト・テクノロジー:
製造業におけるデジタルスレッドとは?デジタルツインとの違いや活用事例について詳しく解説 (20240119) => https://www.cct-inc.co.jp/koto-online/archives/379 -
SB C&S ENGINEERING VOICE:
【SIEMENS】デジタルスレッド実現の鍵! -Teamcenter- => https://licensecounter.jp/engineer-voice/blog/articles/20241003_siemensplm_of_the_future_-teamcenter-.html -
Teradata:
自動車業界でデジタルスレッドが重要な理由 (20210207) => https://www.teradata.jp/blogs/from-product-cycle-to-digital-thread -
Rockwell Automation:
デジタルスレッドの実現には計画が必要 (20220720) => https://www.rockwellautomation.com/ja-jp/company/news/blogs/digital-thread-journey.html
デジタルスレッドで企業をつなげる => https://www.rockwellautomation.com/ja-jp/company/news/magazines/connect-your-enterprise-with-the-digital-thread.html -
株式会社APPSWINGBY:
デジタルスレッドとは?製造業におけるDX (20250402) => https://appswingby.com/it-pickupit-trend/デジタルスレッドとは製造業におけるdx/ -
タタコンサルタンシーサービシズ(TCS):
デジタルスレッドで製品データの価値を解き放つ => https://www.tcs.com/jp-ja/trends/enterprise-digital-threads
デジタル製品開発におけるデジタルスレッドの役割 (202206) => https://www.tcs.com/jp-ja/trends/the-role-of-the-digital-thread-in-digital-product-development -
Mendix:
AIとデータファブリックが製品ライフサイクルをどのように再定義するか (20251113) => https://www.mendix.com/ja/blog/AIとデータファブリックが製品ライフサイクルをどのように再定義しているか/ -
クラスメソッド株式会社:
デジタルスレッドによる製造業のデータ統合と生成AI活用のAWSワークショップ (20241230) => https://dev.classmethod.jp/articles/workshop-deigital-thread/ -
ACCURIS:
デジタルスレッディング、モデルベースシステム工学、AI (20241029) => https://accuristech.com/ja/a-conversation-on-digital-threading-model-based-systems-engineering-and-the-critical-role-of-ai/ -
Ansys:
ミュレーションのデジタルスレッドの作成 – 製品開発全体でシミュレーションのメリットを増大します。複雑な製品をより迅速に市場に投入することができます。 => https://www.ansys.com/ja-jp/products/connect -
デジxアナ:
データを繋ぐ【デジタルスレッド】とは何か (20231229) => https://digiana.site/digitalthread/ -
sitecorecontenthub.cloud Tech-Clarity):
デジタルスレッドの7つの要素 => https://ptc-p-001.sitecorecontenthub.cloud/api/public/content/b682a9fed79d4a43af2b973099892224 -
Microsoft:
デジタル ツインの進化: シミュレーションベースの デジタル ツインへの道のり (20191216) => https://www.microsoft.com/ja-jp/industry/blog/manufacturing/2019/12/16/digital-twin-simulation-database/ -
Accenture:
スレッドファースト思考 – 膨大な製品データを有効活用するために => https://www.accenture.com/content/dam/accenture/final/capabilities/strategy-and-consulting/industry-x/document/Accenture-think-thread-first-JP.pdf -
DXC Technology:
デジタルトランスフォーメーションが製造業にもたらすメリット => https://dxc.com/jp/ja/insights/perspectives/paper/how_manufacturers_can_reap_the_benefits_of_digital_transformation -
日本機械学会:
東京理科大学におけるデジタルツイン人材の育成 (202212) => https://www.jsme.or.jp/kaisi/1249-18
What is MODSIM? (@20251126)
Google Search:一般サイト参照
-
SIMULIA – Linkedin (10ヶ月前@20251026)
=> https://www.linkedin.com/posts/simulia_what-is-modsim-activity-7283151712163356672-ygnu/ -
3DEXPERIENCE for Academia
Simulation with SIMULIA for Education => https://memko.com.au/industries/academia/simulation-with-simulia-for-education/ -
ARGO GRAPHICS
MODSIMソリューション – 設計業務と解析業務を融合し、製品開発を効率化するMODSIMソリューションをご紹介します。=> https://www.argo-graph.co.jp/solution/modsim.html -
IDAJ
シミュレーションドリブンの設計を実現する“MODSIM”への第一歩 (20230606) => https://www.idaj.co.jp/blog/software/3dexperience-simulia/mod-sim-230606 -
SOLIDWORKS Corporation
モデリングとシミュレーションの統合によりビジネス価値創出を加速 – MODSIMは、SOLIDWORKSワークフローに3DEXPERIENCE Works Simulationを組み込み、どの段階でも検証できるようにすることで、あらゆるプロジェクトの信頼性を向上させます。=> https://www.3dexperienceworks.com/ja/solution/accelerate-business-value-through-unified-modeling-and-simulation-modsim/ -
Lenovo
MODSIMを実践 検証からわかった3D設計・解析に必要なスキルと業務環境とは => https://www.lenovojp.com/business/special/206/ -
ダッソー・システムズ
MODSIMによる新しい設計開発アプローチ => https://events.3ds.com/ja/new-design-development-approach-modsim -
Seizo Trend
製造業界で大注目の「MODSIM」を基礎解説:試作回数7割削減、市場投入速度2倍の事例も (20250131) => https://www.sbbit.jp/st/document/sp/22555
BOM – “engineering BOM data model” by Google (@20251107)
Google Search:一般サイト参照
-
UEL株式会社 – BOMとは?|定義・種類・作成手順・管理ベストプラクティスまで徹底解説
=> https://www.biprogy-uel.co.jp/blog/dx/what-is-bom/ -
現場と人 – BOM(部品表)とは?種類と関連規格をわかりやすく解説
=> https://kaminashi.jp/media/bom -
Dassault Systèmes
SolidWorks Corporation – 部品表 (BOM) 管理とは何ですか? => https://www.solidworks.com/ja/solution/what-is-bill-of-materials-bom-managementDELMIA – Service Engineering => https://www.3ds.com/products/delmia/industrial-engineering/service-engineering
-
第4回:似て非なる2つのBOM・・・E-BOMとM-BOMの違いとは
=> https://www.mcframe.com/column/sekkei-seizou/04.html -
マネジメントのテクノロジーを考える – 「生産革新のためのBOM(部品表)再構築入門」
=> https://mgt-technology.info/bominput/ -
株式会社レイヤーズ・コンサルティング – いまさら聞けないBOM(Bill of Materials)とは?
=> https://www.layers.co.jp/solution/billofmaterials/BOM革新 => https://www.layers.co.jp/consulting-service/bom/
-
AUTODESK – PLMで部品表 (BOM)管理
=> https://www.autodesk.com/jp/solutions/plm/bill-of-materials -
NEC – PLMコラム ~BOM連載シリーズ~
=> https://jpn.nec.com/obbligato/column/series2/2_bom.html -
no+e – 製造業DX推進に不可欠!製造業のBOM(部品表)の基本と活用方法【製造業DXの道具箱 #3】
=> https://note.com/ulcons/n/n999ffa797856 -
NSW – PDM(製品情報管理システム)とCADの連携
=> https://nsw-manufacturing.jp/note/mfg_note_03.html -
OpenBOM Product Structure Explained: Data Models and BOM Visualizations
=> https://www.openbom.com/blog/openbom-product-structure-explained-data-models-and-bom-visualizations-simplified -
PTC – What is the Engineering BOM (eBOM)?
=> https://www.ptc.com/en/technologies/plm/bill-of-materials/ebom -
株式会社レクサー・リサーチ – BOMとは? 基礎知識から作成方法や注意点まで徹底解説
=> https://gdfindi.com/jp/blog-bom/ -
aras – 製造部品リスト(MBOM)
=> https://aras.com/ja-jp/glossary/mbom -
Honda R&D – Development of Engineering BOM Data Management System
=> https://www.hondarandd.jp/point.php?pid=554&lang=en
データ統合 & オントロジー (@20250711)
Google Search:一般サイト参照
-
オントロジーとは? データマネジメント用語をわかりやすく解説 (株式会社NTTデータ バリュー・エンジニア)
=> https://www.nttdata-value.co.jp/glossary/ontology -
オントロジーを利用した知識の共有/再利用 伊藤 英毅 (UNISYSTECHNOLOGYREVIEW第64号,FEB.2000)
=> https://www.biprogy.com/pdf/tec_info/6407.pdf -
Ontology Modeling in Physical Asset Integrity Management (English Edition)
=> Amazon.co.jp -
オントロジーを用いた統合的設計支援環境の実現 (人工知能学会誌 Vo/.14 No.6)
=> https://www.jstage.jst.go.jp/article/jjsai/14/6/14_1051/_pdf -
ライフサイエンス分野のオントロジーを探す・見つける (2019年7月25日 櫛田 達矢(NBDC))
=> https://biosciencedbc.jp/blog/20190725-01.html -
ビッグデータ時代のオントロジー技術 (山口 高平(慶應義塾大学理工学部)(人工知能学会会長))
=> https://umtp-japan.org/pdf/MF2012/MF2012_BigDataandOntologyByYamaguchi.pdf -
[47] 医療情報のデータ統合・共有に役立つ医療オントロジーの日本語化と国際共有について (DBCLS)
=> https://biosciencedbc.jp/event/symposium/togo2024/files/poster47_togo2024.pdf -
オントロジー技術 (キリンホールディングス)
=> https://deus-ex-machina-ism.com/?p=4613 -
RDF によるデータ統合 – NBDC, DBCLS における RDF への取り組み (DBCLS、情報システム研究機構 ライフサイエンス統合データベースセンター 川島秀一 2018/11/1)
=> https://wiki.lifesciencedb.jp/mw/images/d/df/RDF-lecture-03_20181101-3_s.pdf
