Wikimedia Foundation Annual Plan/2023-2024/Product & Technology/ko: Difference between revisions

From Meta, a Wikimedia project coordination wiki
Content deleted Content added
Created page with "공용을 시작으로 미디어 관련 워크플로와 '''미디어'''가 풍부한 콘텐츠의 미래를 탐색합니다."
No edit summary
Line 71: Line 71:
* 오디오를 포함한 모바일 경험을 탐색, 개선하고 우선순위를 정하며,
* 오디오를 포함한 모바일 경험을 탐색, 개선하고 우선순위를 정하며,
* SEO에 대한 작업을 계속하고 점진적인 독자 개선을 가능하게 하고,
* SEO에 대한 작업을 계속하고 점진적인 독자 개선을 가능하게 하고,
* ML 지원 자연어 검색 경험을 살펴봅니다.
* ML 지원 자연어 검색 경험을 탐색하고
* 공용을 시작으로 미디어 관련 워크플로와 '''미디어'''가 풍부한 콘텐츠의 미래를 탐색합니다.
* 공용을 시작으로 미디어 관련 워크플로와 '''미디어'''가 풍부한 콘텐츠의 미래를 탐색합니다.
<div lang="en" dir="ltr" class="mw-content-ltr">
<div lang="en" dir="ltr" class="mw-content-ltr">

Revision as of 09:49, 6 May 2024

이 페이지에서는 위키미디어 재단의 제품기술 부서가 2023-24년 연간 계획을 어떻게 준비하고 있는지 설명합니다. 여기에는 작업 포트폴리오(명목적으로 "버킷"이라고 함)와 그에 대한 몇 가지 잠재적인 목표가 포함되어 있습니다. 이러한 내용은 최대한 빨리 공유되었지만 진행 중인 작업이므로 변경되었다는 점을 알아두시기 바랍니다.

이 문서의 2부에서는 부서의 최종 목표 및 주요 결과(OKR)를 다룹니다.

"이 페이지는 Diff의 블로그 게시물 요약 형식으로도 제공됩니다."
"이 페이지는 더 큰 프로세스의 초기 및 개념적 단계에 관한 것이므로 영어로만 제공됩니다. 이후 문서는 모두 번역되었습니다."
"관련 블로그 게시물의 번역을 환영합니다."
셀레나의 인물 사진
셀레나의 인물 사진

제 이름은 셀레나 데켈만이고 위키미디어 재단의 새로운 제품 및 기술 최고책임자입니다. 우리가 함께 일하는 방식을 개선할 수 있는 방법에 대한 모든 생각을 여러분과 공유할 수 있는 기회를 갖게 되어 기쁩니다. 여러분도 우리와 공유하고 싶은 아이디어가 있다는 것을 알고 있으며, 그 의견을 듣고 싶습니다.

제가 재단에서 이 역할을 맡은 이유는 지식을 자유롭고 접근 가능하게 유지하려는 운동 전반에 걸쳐 제가 보는 열정의 깊이 때문입니다. 저는 오픈 소스 프로젝트를 위해 컴퓨터를 다루면서 자원 봉사자로 경력을 시작했으며 그 이후로 모든 사람이 더 환영받고, 접근 가능하며 안전한 기술 공간을 만들기 위해 많은 시간을 보냈습니다. 저는 우리와 같은 글로벌 운동에 자원봉사자들이 얼마나 중요한지 알고 있습니다.

저는 우리 팀이 수행한 작업을 자랑스럽게 생각하며 자원봉사자들이 위키백과에 가져오는 지식, 전문 지식, 시간 및 관심에 지속적으로 깊은 인상을 받습니다. 또한 저는 현재 위키미디어 재단 직원이 수행하는 작업에 대해 자원봉사자에게 언제든지 최신 정보를 제공할 수 있는 명확하고 신뢰할 수 있는 방법이 없다는 것을 알고 있습니다. 우리는 우리의 계획과 프로젝트를 보다 쉽게 전달하고, 여러분의 아이디어와 질문을 듣고 싶습니다. 저는 또한 거기에 도달하는 방법을 결정하는 과정이 협력적일 것이기 때문에 우리가 몇 가지를 시도할 때 거의 확실히 약간 지저분하다는 것을 인정하고 싶습니다. 하지만 목표는 도움이 되고 의미 있다고 생각되는 솔루션을 향해 함께 노력하는 것입니다.

이를 염두에 두고 회계연도 2023-2024년(FY 23-24)에 대해 초안을 작성한 몇 가지 잠재적 목표를 공유하고 싶습니다. 이것은 우리가 확실히 하려고 하는 일의 목록이 아닙니다. 여러분의 질문과 제안을 위한 공간은 충분합니다. 이 목록의 목적은 운동 전반에 걸쳐 가장 필요하고 중요한 기술 작업 범주를 강조하는 것입니다. 우선순위를 조정하기 위해 협력함으로써 우리는 각 목표 내의 프로젝트와 관련하여 시간과 에너지가 가장 효과적으로 사용되도록 할 수 있습니다.

요약

위키미디어 재단에서 우리가 하는 작업은 다양한 목적을 가지고 있으며 사회 기술 생태계로 설명됩니다. 해당 생태계 내에서 제품기술 부서는 중요한 서비스를 제공하고, 신제품을 설계 및 출시하며, 기계 학습 및 인터넷 기반 협업 분야에서 혁신을 이루고 있습니다. 다년간의 전략 계획과 올해의 연간 계획을 생각하면서 우리는 위키미디어의 역사적 성공을 바탕으로 한 핵심 업무 영역을 파악하고, 운동 전략 권장 사항의 발전과 직접 관련되며, 명확하고 가시적인 로드맵을 제공하려고 노력하고 있습니다. 내부 및 외부의 이해관계자.

작업 방식:

앞으로 제품 및 기술 부서의 작업에 집중하기 위해 계획 목적으로 랭글러(우선순위를 결정하는 제품 및 기술 부서 리더)를 "버킷"에 할당합니다. 이러한 랭글러 그룹은 계획 프로세스를 통해 최고 수준의 목표와 주요 결과를 식별할 것입니다. 우리는 가장 중요한 목표를 달성하기 위해 서로 의지하는 사람들을 하나로 모으고 싶습니다.

"세 가지 핵심" 버킷의 중요한 측면은 한 버킷 내의 작업이 다른 버킷의 작업을 차단하지 않는다고 선언한다는 것입니다. 즉, 우리는 여전히 서로 협의하고 정보를 제공하며 적절한 경우 작업을 활성화하기 위해 협력하지만 팀은 다른 버킷의 누군가가 작업을 방해하지 않고 계획을 진행하기로 결정을 내릴 수 있습니다.

예산 계획:

아직 서로 다른 버킷 간에 약정된 예산 할당이 없습니다. 이는 나중에 제공될 예정입니다. 제품 및 기술 부서 모두에서 위키 경험은 약 50%, 신호 및 서비스는 약 30%, 미래의 잠재고객은 약 5%, 인프라 및 제품 및 엔지니어링 서비스는 나머지가 될 것으로 예상됩니다. 이러한 추정치는 현재 수행 중인 작업을 기반으로 합니다. 3월에 목표의 우선순위를 정하기 전까지는 FY23-24 예산 할당을 알 수 없습니다.

가장 큰 두 가지 버킷의 목적을 구별하는 간단한 방법은 다음과 같습니다. 위키 경험은 핵심 위키 경험(위키, 모바일 앱, 도구 등)을 통해 콘텐츠와 상호 작용하는 청중에 중점을 둡니다. 신호 및 데이터 서비스는 콘텐츠/메타데이터에 대한 통찰력을 찾고, 콘텐츠 및 서비스에 대한 결정을 내리며, 구조적 또는 프로그래밍 방식으로 콘텐츠와 상호 작용하는 청중에게 서비스를 제공합니다.

위키 경험

Diversity (40786) – The Noun Project
Diversity (40786) – The Noun Project
ℹ️ "약 50%"

이 버킷의 목적은 전 세계에 무료 지식을 배포할 수 있는 위키 경험을 효율적으로 제공, 개선 및 혁신하는 것입니다. 이 버킷은 이동 전략 권장 사항 #2(사용자 경험 개선) 및 #3(안전 및 포용성 제공)에 부합합니다. 우리의 청중에는 우리 웹사이트의 모든 협력자뿐만 아니라 독자와 기타 무료 지식 소비자도 포함됩니다. 우리는 상위 10개 글로벌 웹사이트와 기타 중요한 무료 문화 리소스를 지원합니다. 이러한 시스템은 세계 최대 기술 기업과 동등한 성능 및 가동 시간 요구 사항을 갖추고 있습니다. 우리는 자원봉사자들이 협력하여 전 세계적으로 무료 지식을 생산할 수 있는 강력한 플랫폼을 형성하는 위키, 번역, 개발자 API(및 기타!) 및 지원 애플리케이션과 인프라에 대한 사용자 인터페이스를 제공합니다. 이 버킷에 대한 우리의 목표는 우리의 핵심 기술과 역량을 향상시키고, 프로젝트의 자원 편집자와 조정자의 경험을 지속적으로 개선하고, 위키 경험을 개선하거나 향상시키기 위해 노력하는 모든 기술 기여자의 경험을 향상시키고, 전 세계 자유 지식의 독자와 소비자를 위한 훌륭한 경험입니다. 우리는 제품과 기술 작업뿐만 아니라 연구와 마케팅을 통해 이를 수행할 것입니다. 이 버킷에는 최대 5개의 목표가 있을 것으로 예상됩니다.

지식은 사람이 만듭니다! 결과적으로 우리의 연간 계획은 콘텐츠뿐만 아니라 콘텐츠에 기여하는 사람, 콘텐츠에 접근하고 읽는 사람에도 초점을 맞출 것입니다.

우리의 목표는 기존 전략, 주로 기여자, 소비자 및 콘텐츠 "플라이휠"에 대한 가설을 기반으로 운영 계획을 수립하는 것입니다. 제가 요청하는 주요 변화는 플라이휠의 콘텐츠 부분에 중점을 두고 향후 커뮤니티 건강 지표를 식별하기 위한 목표로 중재자와 임원이 현재 우리에게 필요로 할 수 있는 것이 무엇인지 탐색하는 것입니다.

목표

고품질의 접근 가능한 경험을 활성화하고 지원함으로써 세계에서 가장 언어적으로 다양하고 신뢰할 수 있으며 포괄적인 자유 지식 생태계 내에서 고품질의 관련 콘텐츠의 성장을 지원합니다

다음과 같은 잠재적인 계획을 통해 중재자, 점검자 및 임원에게 제공되는 만족과 지원을 장려합니다:

  • 다음을 통해 중재자 및 기타 기능적 커뮤니티 상태에 대한 제품 가설을 개발하고 테스트합니다:
    • 워크플로 개선을 위한 ML/AI 지원 접근 방식을 포함하여 심층적인 연구에 참여하면서 유망한 가설에 따라 행동.
    • 중재자 및 기타 기능적 백로그와 현재 자원 봉사 기여자가 사용하는 워크플로의 품질에 대한 측정항목을 탐색 및 개발하고 모니터링.
    • 시간이 지남에 따라 청중 유형과 기여자 수를 측정하는 방법을 정의
    • 커뮤니티 건강에 대한 질적 및 양적 측정 개발
    • 효과적이고 협력적인 커뮤니티 개발 및 건강을 가능하게 하기 위한 툴링, 피드백 메커니즘, 채용 탐구를 포함하되 이에 국한되지 않는 편집자 출력, 자원 봉사 기술 기여자 및 중재자 작업 사이의 "댄스 파트너" 모델을 검토.
  • 점점 더 모바일이 우선시되는 세상에서 고객을 위한 모바일 경험을 지속적으로 탐구하고 개선하며 우선순위를 결정 (예, 중재자 도구)

다음과 같은 잠재적인 계획을 통해 대규모로 위키 편집자를 지원합니다:

  • 건강하고 지속 가능한 커뮤니티를 지원하는 커뮤니케이션 도구를 개선
  • ML 지원 콘텐츠 생성, 기계 지원 번역 및 기타 도구를 가능하게 하는 도구와 워크플로를 제공하는 중간 규모 위키의 콘텐츠 성장을 지원
  • 점점 더 모바일이 우선시되는 세상에서 모바일 경험을 지속적으로 탐구하고 개선하며 우선순위를 정합니다.

다음과 같은 잠재적인 이니셔티브를 통해 개발 방식을 계속해서 개선합니다:

  • 가능한 경우 플랫폼 지원을 위한 셀프 서비스 모델로 전환합니다.
  • 코덱스 디자인 시스템을 채택합니다.

프로젝트를 위한 현대적이고 관련성이 높으며 접근 가능한 독서 및 미디어 경험을 제공합니다

다음과 같은 잠재적인 이니셔티브를 통해 독자 경험을 지속적으로 개선합니다:

  • 오디오를 포함한 모바일 경험을 탐색, 개선하고 우선순위를 정하며,
  • SEO에 대한 작업을 계속하고 점진적인 독자 개선을 가능하게 하고,
  • ML 지원 자연어 검색 경험을 탐색하고
  • 공용을 시작으로 미디어 관련 워크플로와 미디어가 풍부한 콘텐츠의 미래를 탐색합니다.

Support the funding of Wikimedia projects by making sustainable the technology behind our largest and emerging revenue sources

  • Provide the necessary tools for all aspects of advancement/fundraising to be the best at their jobs.
  • Explore the native mobile app donation workflows to reduce donor friction and other Mobile use cases for future fundraising.

Produce an effective & efficient knowledge production platform

Improve MediaWiki platform development that reduces toil, incorporates best practices, and maintains our commitment to open source development practices, through potential initiatives like:

  • This includes considering the developer experience of volunteer technical contributors.
  • Define what “core MediaWiki is” to establish good boundaries between the work of MediaWiki platform and feature development teams.
  • Define and support moving to a self-service model for MediaWiki feature development that interfaces with a well-defined “back end” website architecture.
  • Continue to improve our infrastructure platform, developing more self-service components and ensuring stable and reliable infrastructure services.
  • Establish a comprehensive open source strategy for the Foundation.

Signals and Data Services

Arrythmia noun 246518
Arrythmia noun 246518
ℹ️ About 30%

In order to meet the Movement Strategy Recommendations for Ensuring Equity in Decision Making (Recommendation #4), Improving User Experience (Recommendation #2), and Evaluating, Iterating and Adapting (Recommendation #10), decision makers from across the Wikimedia Movement must have access to reliable, relevant, and timely data, models, insights, and tools that can help them assess the impact (both realized and potential) of their work and the work of their communities, enabling them to make better strategic decisions.

In the Signals & Data Services bucket, we have identified four primary audiences: Wikimedia Foundation staff, Wikimedia affiliates and user groups, developers who reuse our content, and Wikimedia researchers, and we prioritize and address the data and insights needs of these audiences. Our work will span a range of activities: defining gaps, developing metrics, building pipelines for computing metrics, and developing data and signals exploration experiences and pathways that help decision makers interact more effectively and joyfully with the data and insights.

Objectives

Each metric and dimension in our essential metric data set is scientifically or empirically supported, standardized, productionized, and shared across the Foundation.

Effective use of metrics to make strategic decisions at the Foundation requires us to measure and assess the impact of work using a common, reliable, and well-understood set of metrics. Ensuring that different teams working on different projects are using the same metrics with the same definitions to understand the impact of their work will allow us to ensure we are “speaking the same language”, and better coordinate efforts across the foundation, with affiliates, and with the community. These metrics will allow Foundation staff to monitor the value of their work and the community to see the value of the Foundation. And establishing a standard set of metrics allows the engineers supporting the tools used in data preparation and analysis to deliver a higher standard of service by more precisely defining the scope of their work, making the effort more tractable.

Potential Key Results:

  • Identify and define the key essential metrics needed to evaluate program progress and assess impact.
  • Establish standardized definitions, calculations, and data sources for each metric and dimension in the essential metric data set.
  • Provide training and support to relevant stakeholders on how to use and interpret the essential metrics.

Wikimedia staff and leadership make data-driven decisions by using essential metrics to evaluate program progress and assess impact

By using essential metrics to evaluate program progress and assess impact, we can ensure that we are making informed decisions that are backed by evidence. This allows us to stay focused on our most important goals, make adjustments as needed, and track our progress over time.

Potential Key Results:

  • Five Wikimedia initiatives or projects use essential metrics to evaluate progress.
  • Develop and implement a dashboard that displays essential metrics.

Data users can easily find our essential metric data and access information about it: how to interpret them, where they are sourced, how they are produced, appropriate and inappropriate uses, privacy and ethical guidance, and what limitations they have

Data is not useful if it is not accessible. Our metrics must have maximum accessibility for us to maximize their utility to all audiences. To guide appropriate use and prevent misuse, we gather, organize, and make available the necessary information.

Potential Key Results:

  • 100% of essential datasets have designated business owners/data stewards
  • Six Metrics that Matter data sets are fully and publicly documented with clear guidance on how to use and consume
  • 100% of essential metric data that are reliably tracked in the Foundation-Level Metrics Framework are cataloged with respect to sourcing and production

We establish standards for quality and examine the quality of essential metric data via regular review

Metrics must have known and verified quality to be trusted to guide major strategic decisions. Standards for the quality of essential metric data must be determined and published to provide the evidence that our metrics can be used to support strategic decisions.

Potential Key Results:

  • Six Metrics That Matter data sets contain logging, monitoring, and alerting for data quality incidents based on business owner/data steward-informed SLOs/SLIs.
  • 100% of potential essential metrics data issues are triaged by essential metrics business owners/data stewards within 10 business days of the issue being reported.

Users can reliably query Wikimedia data at scale

Search and discovery experiences are critical to how users experience our content. We must be able to deliver those experiences in a reliable, sustainable, scalable fashion to meet the needs of free knowledge distribution and discovery.

Potential Key Results:

  • Increase the number of successfully processed backend Wikidata requests by 25%.
    • ALTERNATIVE: Decrease the number of failing backend Wikidata requests by X%?
    • Experiment top three recommendations in the WDQS stabilization plan and document outcomes
  • Experiment with # improvements for Wikipedia reader 1st party search basic functionality

Future Audiences

ℹ️ (About 5%)

The purpose of this bucket is to explore strategies for expanding beyond our existing audiences of consumers and contributors, in an effort to truly reach everyone in the world as the essential infrastructure of the ecosystem of free knowledge. This bucket aligns with Movement Strategy Recommendation #9 (Innovate in Free Knowledge). More and more, people are consuming information in experiences and forms that diverge from our traditional offering of a website with articles – people are using voice assistants, spending time with video, engaging with AI, and more. In this bucket, we will propose and test hypotheses around potential long-term futures for the free knowledge ecosystem and how we will be its essential infrastructure. We will do this through product and technology work, as well as through research, partnerships, and marketing. As we identify promising future states, learnings from this bucket will influence and be expanded through Buckets #1 and #2 in successive annual plans, nudging our product and technology offerings toward where they need to be to serve knowledge-seekers of the future. Our objectives for this bucket should drive us to experiment and explore as we bring a vision for the future of free knowledge into focus.

Objectives

Describe multiple potential strategies through which Wikimedia could satisfy our goal of being the essential infrastructure of the ecosystem of free knowledge

We know we want Wikimedia to become the essential infrastructure of the ecosystem of free knowledge, but there are multiple different ways we could do this, and different audiences on which we could concentrate.  Our movement has not yet settled on a path to achieving this goal.  We will come up with different discrete ways that we could be the essential infrastructure.  These candidate strategies are what we’re investigating in this bucket – which one or ones are the future we should inhabit to complete our mission?  For each of them, we will identify the audiences they address, and we’ll develop hypotheses to test that will help us collectively decide whether that strategy seems right for our future.

Beginnings of key results / deliverables:

  • Develop five candidate strategies for reaching future audiences as the essential infrastructure, and describe the audiences these strategies would reach.
  • For each candidate strategy, identify hypotheses and approaches for testing them.
  • Publish explanations of the candidate strategies.

Test hypotheses to validate or invalidate potential strategies for the future, starting with a focus on third party content platforms

Committing to a strategy for the long-term is a major choice that our movement needs to make wisely.  The core work of this bucket will be the research and experiments that can help us foresee which paths hold the most potential.  For the candidate strategies that come from the previous objective, we will identify hypotheses that probe the core of those strategies, and then do the research, proofs-of-concept, and investigations that help us learn whether those strategies do or don’t seem like good paths into the future.

Though we’ll be open to many different strategies, we do know we want to prioritize investigating “third party content platforms”, because if we want to reach everyone in the world with free knowledge, we’ll need to reach them where they are on the internet – these days, they can be found on the many social and content platforms that go beyond our historical channels of search engines and our own websites.

Beginnings of key results / deliverables:

  • Publish guiding principles for how we test hypotheses and how we take action with successes and failures
  • Pursue global youth audiences, which have a concerningly low awareness of Wikimedia projects
  • Explore the leading candidate strategy of consumption and contribution through third party content platforms
  • Build a self-storage solution that enables low-cost prototyping of software ideas

Build alignment around a continuously sharpening vision of the future

Though our movement has agreed on becoming the essential infrastructure of the ecosystem of free knowledge, different parts of our movement see our path to getting there differently.  But the more we’re able to pull in the same direction, the more likely we’ll succeed in our goals.  As we test hypotheses and learn more about what our future strategies could be, we need to spread our learnings and their implications for the future.  We also need to seek input from our colleagues and communities.  By doing these things, we will help align our movement to achieve bigger things together.

Beginnings of key results / deliverables:

  • Bring a set of learnings to annual planning 2024–25 that influences the work of Buckets #1 and #2.
  • Develop community groups or conversations around “future audiences” that include both longtime trusted community members and new voices that represent the audiences we’re pursuing.

Sub-buckets

Noun project 3067
Noun project 3067
ℹ️ About 15%

We also have two other “sub-buckets” which consist of areas of critical functions, which must exist at the Foundation to support our basic operations, and some of which we have in common with any software organization. These “sub-buckets” won’t have top level objectives of their own, but will have input on and will support the top level objectives of the other groups. They are:

  1. Infrastructure Foundations. This bucket covers the teams which sustain and evolve our data centers, our compute and storage platforms, the services to operate them, the tools and processes that enable the operation of our public facing sites and services.
  2. Product and Engineering Services. This bucket includes teams which operate “at scale” providing services to other teams that improve the productivity and operations of other teams.

Keywords

  • AccessibleThe experience of locating and retrieving relevant Wikimedia data sets or viewing relevant reporting is self-directed and easy.
  • Buckets: These are a portfolio of work with a budget allocation attached. These will be the highest order grouping of all our work. They are intended as containers that help us make decisions about priorities/objectives and allocation of our budget. Importantly, though, buckets are not rearranging people and teams.
  • Committed Work: Work that is tied to a contract, regulatory or legal requirement, or other significant commitment. Not completing this kind of work would subject us to significant legal, financial or reputational risk. Risk assessments which result in not completing something considered committed work should be reviewed by Director+ level for approval before deprioritizing the work. Approval level should match where the commitment was made.
  • Core Metric One of a small set of well-defined data element that measures something we use to guide strategic decisions.
  • Contributing MetricA measure that contributes directly to the explanatory picture of a core metric; e.g. session length.
  • Data Product - a product that facilitates an end goal through the use of data (DJ Patil, Data Jujitsu: The Art of Turning Data into Product, 2012). Products types can be raw data, derived data, algorithms, decision support, and automated decision-making
  • DimensionA data element that is used to narrow or focus the analysis of a metric; e.g. timestamps, language codes, country codes, DNS names, test treatment set, etc.
  • DiscoverableNew and experienced users of data are able to find and use / reuse the data elements relevant to their use cases.
  • Essential Metric DataThe set of data elements that includes all core metrics, and all contributing metrics and standard dimensions used to analyze and understand core metrics.
  • IntegrableIt is easy to use data sets from different sources in combination with one another.
  • MetadataData about data. E.g. location, modification time, ownership, format, access permissions, privacy sensitivity, documentation, etc.
  • NavigableThe relationships between data elements are documented and defined. OKR: We will be creating 3 levels of cascading OKRs. For convenience sake, we are labeling each level. Here are the levels:
    • Top-level Metric: These are the highest level, the metrics by which we expect to judge our progress as departments. We expect to have 4ish of these.
    • Objective: This is the mid-level objective, owned by directors. We expect there to be 1-4 of these in each bucket, and each one will comprise the work of 30-40 people.
    • Hypothesis or BetThis is the team level, and is a specific project or task which a team is proceeding with, and has evaluation criteria for. This should be associated with some key result for evaluation of success.
  • PreparedThe data is in or close to the format in which the user wants to consume it.
  • ReliableData products are ‘reliable’ within defined constraints (e.g. SLOs). Reliability of data products includes:
    • Availabledata is online and available with predictable query and response time characteristics.
    • Freshdata is ‘fresh’ within a timeframe.
    • Eventually consistentPrimary and derived data items are eventually consistent across data products. E.g. a wikidata item has the same values in wikidata as it does in WDQS with predictable latency.
  • SourceableIt is easy to load data into systems for serving production features and analytics.
  • StandardizedThe same definition is used for a data element across all Wikimedia work.
  • System - The totality of all actors, components, and processes involved in creation, transformation, and distribution of data.
  • Technical Contributors: developers, wiki template editors, technical documentation writers, bug reporters.
  • Wranglers: Product and Technology leaders responsible for creating, estimating and prioritizing potential objectives and supporting the teams in proposing work to achieve the objectives and defining metrics.
  • Wikimedia dataInclusive of all gathered and generated data in our systems – text content (including wikitext constructs), multimedia files, user-generated data files, observed facts, inferences, metrics and metadata.
  • Well-definedData elements and records each have definitions that explain their provenance, appropriate and inappropriate uses, formats, constraints, expected ranges/distributions, and restrictions.