diff --git a/_autosummary/cellxgene_census.get_anndata.html b/_autosummary/cellxgene_census.get_anndata.html
index 989bfb102..7fe7d06eb 100644
--- a/_autosummary/cellxgene_census.get_anndata.html
+++ b/_autosummary/cellxgene_census.get_anndata.html
@@ -207,9 +207,9 @@
 <h1>cellxgene_census.get_anndata<a class="headerlink" href="#cellxgene-census-get-anndata" title="Permalink to this heading">¶</a></h1>
 <dl class="py function">
 <dt class="sig sig-object py" id="cellxgene_census.get_anndata">
-<span class="sig-prename descclassname"><span class="pre">cellxgene_census.</span></span><span class="sig-name descname"><span class="pre">get_anndata</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">census</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Collection</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">organism</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a></span></em>, <em class="sig-param"><span class="n"><span class="pre">measurement_name</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'RNA'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">X_name</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'raw'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">X_layers</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">()</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">obsm_layers</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">()</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">obs_value_filter</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">obs_coords</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">TimestampType</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><span class="pre">TimestampType</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><span class="pre">TimestampType</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Array</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">ChunkedArray</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.ndarray.html#numpy.ndarray" title="(in NumPy v1.26)"><span class="pre">ndarray</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Any" title="(in Python v3.12)"><span class="pre">Any</span></a><span class="p"><span class="pre">,</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.dtype.html#numpy.dtype" title="(in NumPy v1.26)"><span class="pre">dtype</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.integer" title="(in NumPy v1.26)"><span class="pre">integer</span></a><span class="p"><span class="pre">]</span></span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.ndarray.html#numpy.ndarray" title="(in NumPy v1.26)"><span class="pre">ndarray</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Any" title="(in Python v3.12)"><span class="pre">Any</span></a><span class="p"><span class="pre">,</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.dtype.html#numpy.dtype" title="(in NumPy v1.26)"><span class="pre">dtype</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="p"><span class="pre">]</span></span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">var_value_filter</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">var_coords</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">TimestampType</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><span class="pre">TimestampType</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><span class="pre">TimestampType</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Array</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">ChunkedArray</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.ndarray.html#numpy.ndarray" title="(in NumPy v1.26)"><span class="pre">ndarray</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Any" title="(in Python v3.12)"><span class="pre">Any</span></a><span class="p"><span class="pre">,</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.dtype.html#numpy.dtype" title="(in NumPy v1.26)"><span class="pre">dtype</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.integer" title="(in NumPy v1.26)"><span class="pre">integer</span></a><span class="p"><span class="pre">]</span></span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.ndarray.html#numpy.ndarray" title="(in NumPy v1.26)"><span class="pre">ndarray</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Any" title="(in Python v3.12)"><span class="pre">Any</span></a><span class="p"><span class="pre">,</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.dtype.html#numpy.dtype" title="(in NumPy v1.26)"><span class="pre">dtype</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="p"><span class="pre">]</span></span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">column_names</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">AxisColumnNames</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><a class="reference external" href="https://anndata.readthedocs.io/en/latest/generated/anndata.AnnData.html#anndata.AnnData" title="(in anndata v0.11.0.dev37+g63e6b29)"><span class="pre">AnnData</span></a></span></span><a class="headerlink" href="#cellxgene_census.get_anndata" title="Permalink to this definition">¶</a></dt>
+<span class="sig-prename descclassname"><span class="pre">cellxgene_census.</span></span><span class="sig-name descname"><span class="pre">get_anndata</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">census</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Collection</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">organism</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a></span></em>, <em class="sig-param"><span class="n"><span class="pre">measurement_name</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'RNA'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">X_name</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">'raw'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">X_layers</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">()</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">obsm_layers</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">()</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">obs_value_filter</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">obs_coords</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">TimestampType</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><span class="pre">TimestampType</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><span class="pre">TimestampType</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Array</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">ChunkedArray</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.ndarray.html#numpy.ndarray" title="(in NumPy v1.26)"><span class="pre">ndarray</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Any" title="(in Python v3.12)"><span class="pre">Any</span></a><span class="p"><span class="pre">,</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.dtype.html#numpy.dtype" title="(in NumPy v1.26)"><span class="pre">dtype</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.integer" title="(in NumPy v1.26)"><span class="pre">integer</span></a><span class="p"><span class="pre">]</span></span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.ndarray.html#numpy.ndarray" title="(in NumPy v1.26)"><span class="pre">ndarray</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Any" title="(in Python v3.12)"><span class="pre">Any</span></a><span class="p"><span class="pre">,</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.dtype.html#numpy.dtype" title="(in NumPy v1.26)"><span class="pre">dtype</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="p"><span class="pre">]</span></span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">var_value_filter</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">var_coords</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#bytes" title="(in Python v3.12)"><span class="pre">bytes</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#float" title="(in Python v3.12)"><span class="pre">float</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#int" title="(in Python v3.12)"><span class="pre">int</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/functions.html#slice" title="(in Python v3.12)"><span class="pre">slice</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/stdtypes.html#str" title="(in Python v3.12)"><span class="pre">str</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">TimestampType</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Slice</span><span class="p"><span class="pre">[</span></span><span class="pre">TimestampType</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Sequence" title="(in Python v3.12)"><span class="pre">Sequence</span></a><span class="p"><span class="pre">[</span></span><span class="pre">TimestampType</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">Array</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">ChunkedArray</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.ndarray.html#numpy.ndarray" title="(in NumPy v1.26)"><span class="pre">ndarray</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Any" title="(in Python v3.12)"><span class="pre">Any</span></a><span class="p"><span class="pre">,</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.dtype.html#numpy.dtype" title="(in NumPy v1.26)"><span class="pre">dtype</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.integer" title="(in NumPy v1.26)"><span class="pre">integer</span></a><span class="p"><span class="pre">]</span></span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.ndarray.html#numpy.ndarray" title="(in NumPy v1.26)"><span class="pre">ndarray</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://docs.python.org/3/library/typing.html#typing.Any" title="(in Python v3.12)"><span class="pre">Any</span></a><span class="p"><span class="pre">,</span></span><span class="w"> </span><a class="reference external" href="https://numpy.org/doc/stable/reference/generated/numpy.dtype.html#numpy.dtype" title="(in NumPy v1.26)"><span class="pre">dtype</span></a><span class="p"><span class="pre">[</span></span><a class="reference external" href="https://numpy.org/doc/stable/reference/arrays.scalars.html#numpy.datetime64" title="(in NumPy v1.26)"><span class="pre">datetime64</span></a><span class="p"><span class="pre">]</span></span><span class="p"><span class="pre">]</span></span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">column_names</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">AxisColumnNames</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><a class="reference external" href="https://docs.python.org/3/library/constants.html#None" title="(in Python v3.12)"><span class="pre">None</span></a></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span> <span class="sig-return"><span class="sig-return-icon">&#x2192;</span> <span class="sig-return-typehint"><a class="reference external" href="https://anndata.readthedocs.io/en/latest/generated/anndata.AnnData.html#anndata.AnnData" title="(in anndata v0.11.0.dev40+g2abc89a)"><span class="pre">AnnData</span></a></span></span><a class="headerlink" href="#cellxgene_census.get_anndata" title="Permalink to this definition">¶</a></dt>
 <dd><p>Convience wrapper around <code class="docutils literal notranslate"><span class="pre">soma.Experiment</span></code> query, to build and execute a query,
-and return it as an <a class="reference external" href="https://anndata.readthedocs.io/en/latest/generated/anndata.AnnData.html#anndata.AnnData" title="(in anndata v0.11.0.dev37+g63e6b29)"><code class="xref py py-class docutils literal notranslate"><span class="pre">anndata.AnnData</span></code></a> object.</p>
+and return it as an <a class="reference external" href="https://anndata.readthedocs.io/en/latest/generated/anndata.AnnData.html#anndata.AnnData" title="(in anndata v0.11.0.dev40+g2abc89a)"><code class="xref py py-class docutils literal notranslate"><span class="pre">anndata.AnnData</span></code></a> object.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
 <dd class="field-odd"><ul class="simple">
@@ -231,7 +231,7 @@ <h1>cellxgene_census.get_anndata<a class="headerlink" href="#cellxgene-census-ge
 </ul>
 </dd>
 <dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><p>An <a class="reference external" href="https://anndata.readthedocs.io/en/latest/generated/anndata.AnnData.html#anndata.AnnData" title="(in anndata v0.11.0.dev37+g63e6b29)"><code class="xref py py-class docutils literal notranslate"><span class="pre">anndata.AnnData</span></code></a> object containing the census slice.</p>
+<dd class="field-even"><p>An <a class="reference external" href="https://anndata.readthedocs.io/en/latest/generated/anndata.AnnData.html#anndata.AnnData" title="(in anndata v0.11.0.dev40+g2abc89a)"><code class="xref py py-class docutils literal notranslate"><span class="pre">anndata.AnnData</span></code></a> object containing the census slice.</p>
 </dd>
 </dl>
 <p class="rubric">Lifecycle</p>
diff --git a/_sources/cellxgene_census_docsite_landing.md.txt b/_sources/cellxgene_census_docsite_landing.md.txt
index 2c21ba21f..a04d1cd92 100644
--- a/_sources/cellxgene_census_docsite_landing.md.txt
+++ b/_sources/cellxgene_census_docsite_landing.md.txt
@@ -16,9 +16,11 @@ Get started:
 
 ![image](cellxgene_census_docsite_workflow.svg)
 
-## Citing the Census
+## Citing Census
 
-Please follow the [citation guidelines](https://cellxgene.cziscience.com/docs/08__Cite%20cellxgene%20in%20your%20publications) offered by CZ CELLxGENE Discover.
+To cite the project please follow the [citation guidelines](https://cellxgene.cziscience.com/docs/08__Cite%20cellxgene%20in%20your%20publications) offered by CZ CELLxGENE Discover.
+
+To cite individual studies please refer to the tutorial [Generating citations for Census slices](notebooks/api_demo/census_citation_generation.ipynb).
 
 ## Census Capabilities
 
diff --git a/_sources/examples.rst.txt b/_sources/examples.rst.txt
index 326e40386..8fd9be54d 100644
--- a/_sources/examples.rst.txt
+++ b/_sources/examples.rst.txt
@@ -12,6 +12,7 @@ Learn how to stream the single-cell data and metadata from Census into your mach
    
     cellxgene_census_docsite_quick_start.md
     notebooks/api_demo/census_query_extract.ipynb
+    notebooks/api_demo/census_citation_generation.ipynb
     notebooks/api_demo/census_gget_demo.ipynb
 
 [NEW! 🚀] Using integrated embeddings and models
diff --git a/_sources/notebooks/api_demo/census_citation_generation.ipynb.txt b/_sources/notebooks/api_demo/census_citation_generation.ipynb.txt
new file mode 100644
index 000000000..f716d170a
--- /dev/null
+++ b/_sources/notebooks/api_demo/census_citation_generation.ipynb.txt
@@ -0,0 +1,310 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "id": "88812eae-6b46-48b4-a1e4-c468657d8480",
+   "metadata": {},
+   "source": [
+    "# Generating citations for Census slices\n",
+    "\n",
+    "This notebook demonstrates how to generate a citation string for all datasets contained in a Census slice.\n",
+    "\n",
+    "**Contents**\n",
+    "\n",
+    "1. Requirements\n",
+    "1. Generating citation strings\n",
+    "   1. Via cell metadata query\n",
+    "   1. Via an AnnData query \n",
+    "\n",
+    "⚠️ Note that the Census RNA data includes duplicate cells present across multiple datasets. Duplicate cells can be filtered in or out using the cell metadata variable `is_primary_data` which is described in the [Census schema](https://github.com/chanzuckerberg/cellxgene-census/blob/main/docs/cellxgene_census_schema.md#repeated-data).\n",
+    "\n",
+    "## Requirements\n",
+    "\n",
+    "This notebook requires:\n",
+    "\n",
+    "- `cellxgene_census` Python package.\n",
+    "- Census data release with [schema version](https://github.com/chanzuckerberg/cellxgene-census/blob/main/docs/cellxgene_census_schema.md) 1.3.0 or greater.\n",
+    "\n",
+    "## Generating citation strings\n",
+    "\n",
+    "First we open a handle to the Census data. To ensure we open a data release with schema version 1.3.0 or greater, we use `census_version=\"latest\"`"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 1,
+   "id": "9a5a5a92-3d78-4542-95a5-e6889f245491",
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>soma_joinid</th>\n",
+       "      <th>label</th>\n",
+       "      <th>value</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>0</td>\n",
+       "      <td>census_schema_version</td>\n",
+       "      <td>1.3.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>1</td>\n",
+       "      <td>census_build_date</td>\n",
+       "      <td>2024-01-01</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>2</td>\n",
+       "      <td>dataset_schema_version</td>\n",
+       "      <td>4.0.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>3</td>\n",
+       "      <td>total_cell_count</td>\n",
+       "      <td>75694072</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>4</td>\n",
+       "      <td>unique_cell_count</td>\n",
+       "      <td>45846761</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>5</th>\n",
+       "      <td>5</td>\n",
+       "      <td>number_donors_homo_sapiens</td>\n",
+       "      <td>16292</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>6</th>\n",
+       "      <td>6</td>\n",
+       "      <td>number_donors_mus_musculus</td>\n",
+       "      <td>2153</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "   soma_joinid                       label       value\n",
+       "0            0       census_schema_version       1.3.0\n",
+       "1            1           census_build_date  2024-01-01\n",
+       "2            2      dataset_schema_version       4.0.0\n",
+       "3            3            total_cell_count    75694072\n",
+       "4            4           unique_cell_count    45846761\n",
+       "5            5  number_donors_homo_sapiens       16292\n",
+       "6            6  number_donors_mus_musculus        2153"
+      ]
+     },
+     "execution_count": 1,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "import cellxgene_census\n",
+    "\n",
+    "census = cellxgene_census.open_soma(census_version=\"latest\")\n",
+    "census[\"census_info\"][\"summary\"].read().concat().to_pandas()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "23174644-7804-4723-a4ab-c5cf75bdd954",
+   "metadata": {},
+   "source": [
+    "Then we load the dataset table which contains a column `\"citation\"` for each dataset included in Census. "
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "id": "d47b636a-d653-4e3b-b139-14b6ca697ce8",
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "0      Dataset Version: https://datasets.cellxgene.cz...\n",
+       "1      Dataset Version: https://datasets.cellxgene.cz...\n",
+       "2      Dataset Version: https://datasets.cellxgene.cz...\n",
+       "3      Dataset Version: https://datasets.cellxgene.cz...\n",
+       "4      Publication: https://doi.org/10.1002/ctm2.1356...\n",
+       "                             ...                        \n",
+       "695    Publication: https://doi.org/10.1038/s41586-02...\n",
+       "696    Publication: https://doi.org/10.1038/s41586-02...\n",
+       "697    Publication: https://doi.org/10.1016/j.isci.20...\n",
+       "698    Publication: https://doi.org/10.1371/journal.p...\n",
+       "699    Publication: https://doi.org/10.1016/j.isci.20...\n",
+       "Name: citation, Length: 700, dtype: object"
+      ]
+     },
+     "execution_count": 2,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "datasets = census[\"census_info\"][\"datasets\"].read().concat().to_pandas()\n",
+    "datasets[\"citation\"]"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "06adfa4a-3656-4f26-9adf-ba28eb2f691e",
+   "metadata": {},
+   "source": [
+    "And now we can use the column `\"dataset_id\"` present in both the dataset table and the Census cell metadata to create citation strings for any Census slice.\n",
+    "\n",
+    "### Via cell metadata query"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "id": "f7edf4a7-8394-4df2-9dde-b24efcd6dbe0",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n"
+     ]
+    }
+   ],
+   "source": [
+    "# Query cell metadata\n",
+    "cell_metadata = census[\"census_data\"][\"homo_sapiens\"].obs.read(\n",
+    "    value_filter=\"tissue == 'cardiac atrium'\", column_names=[\"dataset_id\", \"cell_type\"]\n",
+    ")\n",
+    "cell_metadata = cell_metadata.concat().to_pandas()\n",
+    "\n",
+    "# Get a citation string for the slice\n",
+    "slice_datasets = datasets[datasets[\"dataset_id\"].isin(cell_metadata[\"dataset_id\"])]\n",
+    "print(*slice_datasets[\"citation\"], sep=\"\\n\\n\")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "941c6f2d-6bc2-46c3-963e-e74335fe93f6",
+   "metadata": {},
+   "source": [
+    "### Via AnnData query"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 4,
+   "id": "2d9b2a11-2f48-43a5-8955-759019ce6bed",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n"
+     ]
+    }
+   ],
+   "source": [
+    "# Fetch an AnnData object\n",
+    "adata = cellxgene_census.get_anndata(\n",
+    "    census=census,\n",
+    "    organism=\"homo_sapiens\",\n",
+    "    measurement_name=\"RNA\",\n",
+    "    obs_value_filter=\"tissue == 'cardiac atrium'\",\n",
+    "    var_value_filter=\"feature_name == 'MYBPC3'\",\n",
+    "    column_names={\"obs\": [\"dataset_id\", \"cell_type\"]},\n",
+    ")\n",
+    "\n",
+    "# Get a citation string for the slice\n",
+    "slice_datasets = datasets[datasets[\"dataset_id\"].isin(adata.obs[\"dataset_id\"])]\n",
+    "print(*slice_datasets[\"citation\"], sep=\"\\n\\n\")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "f6988186-5294-43f9-bfe5-2ac255aa0b26",
+   "metadata": {},
+   "source": [
+    "And don't forget to close the Census handle"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 6,
+   "id": "f96b1c3b-4a2a-469a-9ded-1c5ff98b84aa",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "census.close()"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3 (ipykernel)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.11.4"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 5
+}
diff --git a/cellxgene_census_docsite_landing.html b/cellxgene_census_docsite_landing.html
index 04c0b0f50..0e97d999f 100644
--- a/cellxgene_census_docsite_landing.html
+++ b/cellxgene_census_docsite_landing.html
@@ -199,9 +199,10 @@ <h1>CZ CELLxGENE Discover Census<a class="headerlink" href="#cz-cellxgene-discov
 <li><p><a class="reference external" href="https://github.com/chanzuckerberg/cellxgene-census">Github repository</a></p></li>
 </ul>
 <p><img alt="image" src="_images/cellxgene_census_docsite_workflow.svg" /></p>
-<section id="citing-the-census">
-<h2>Citing the Census<a class="headerlink" href="#citing-the-census" title="Permalink to this heading">¶</a></h2>
-<p>Please follow the <a class="reference external" href="https://cellxgene.cziscience.com/docs/08__Cite%20cellxgene%20in%20your%20publications">citation guidelines</a> offered by CZ CELLxGENE Discover.</p>
+<section id="citing-census">
+<h2>Citing Census<a class="headerlink" href="#citing-census" title="Permalink to this heading">¶</a></h2>
+<p>To cite the project please follow the <a class="reference external" href="https://cellxgene.cziscience.com/docs/08__Cite%20cellxgene%20in%20your%20publications">citation guidelines</a> offered by CZ CELLxGENE Discover.</p>
+<p>To cite individual studies please refer to the tutorial <a class="reference internal" href="notebooks/api_demo/census_citation_generation.html"><span class="std std-doc">Generating citations for Census slices</span></a>.</p>
 </section>
 <section id="census-capabilities">
 <h2>Census Capabilities<a class="headerlink" href="#census-capabilities" title="Permalink to this heading">¶</a></h2>
diff --git a/examples.html b/examples.html
index 6347e1f05..224008653 100644
--- a/examples.html
+++ b/examples.html
@@ -151,6 +151,7 @@
 <li class="toctree-l2"><a class="reference internal" href="#exporting-data">Exporting data</a><ul>
 <li class="toctree-l3"><a class="reference internal" href="cellxgene_census_docsite_quick_start.html">Quick start</a></li>
 <li class="toctree-l3"><a class="reference internal" href="notebooks/api_demo/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata.</a></li>
+<li class="toctree-l3"><a class="reference internal" href="notebooks/api_demo/census_citation_generation.html">Generating citations for Census slices</a></li>
 <li class="toctree-l3"><a class="reference internal" href="notebooks/api_demo/census_gget_demo.html">Querying data using the gget cellxgene module</a></li>
 </ul>
 </li>
@@ -235,6 +236,7 @@ <h2>Exporting data<a class="headerlink" href="#exporting-data" title="Permalink
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="cellxgene_census_docsite_quick_start.html">Quick start</a></li>
 <li class="toctree-l1"><a class="reference internal" href="notebooks/api_demo/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata.</a></li>
+<li class="toctree-l1"><a class="reference internal" href="notebooks/api_demo/census_citation_generation.html">Generating citations for Census slices</a></li>
 <li class="toctree-l1"><a class="reference internal" href="notebooks/api_demo/census_gget_demo.html">Querying data using the gget cellxgene module</a></li>
 </ul>
 </div>
diff --git a/index.html b/index.html
index 1a1f48e74..467407fe3 100644
--- a/index.html
+++ b/index.html
@@ -200,9 +200,10 @@ <h1>CZ CELLxGENE Discover Census<a class="headerlink" href="#cz-cellxgene-discov
 <li><p><a class="reference external" href="https://github.com/chanzuckerberg/cellxgene-census">Github repository</a></p></li>
 </ul>
 <p><img alt="image" src="_images/cellxgene_census_docsite_workflow.svg" /></p>
-<section id="citing-the-census">
-<h2>Citing the Census<a class="headerlink" href="#citing-the-census" title="Permalink to this heading">¶</a></h2>
-<p>Please follow the <a class="reference external" href="https://cellxgene.cziscience.com/docs/08__Cite%20cellxgene%20in%20your%20publications">citation guidelines</a> offered by CZ CELLxGENE Discover.</p>
+<section id="citing-census">
+<h2>Citing Census<a class="headerlink" href="#citing-census" title="Permalink to this heading">¶</a></h2>
+<p>To cite the project please follow the <a class="reference external" href="https://cellxgene.cziscience.com/docs/08__Cite%20cellxgene%20in%20your%20publications">citation guidelines</a> offered by CZ CELLxGENE Discover.</p>
+<p>To cite individual studies please refer to the tutorial <a class="reference internal" href="notebooks/api_demo/census_citation_generation.html"><span class="std std-doc">Generating citations for Census slices</span></a>.</p>
 </section>
 <section id="census-capabilities">
 <h2>Census Capabilities<a class="headerlink" href="#census-capabilities" title="Permalink to this heading">¶</a></h2>
diff --git a/notebooks/api_demo/census_citation_generation.html b/notebooks/api_demo/census_citation_generation.html
new file mode 100644
index 000000000..7d247db42
--- /dev/null
+++ b/notebooks/api_demo/census_citation_generation.html
@@ -0,0 +1,572 @@
+
+
+<!DOCTYPE html>
+<html class="writer-html5" lang="en" >
+<head>
+  <meta charset="utf-8">
+  <meta name="generator" content="Docutils 0.19: https://docutils.sourceforge.io/" />
+
+  <meta name="viewport" content="width=device-width, initial-scale=1.0">
+  
+  <title>Generating citations for Census slices &mdash; cellxgene-census  documentation</title>
+  
+
+  
+  <link rel="icon" type="image/png" sizes="32x32" href="../../_static/img/favicon_32x32_v2.png"/>
+  <link rel="icon" type="image/png" sizes="16x16" href="../../_static/img/favicon_16x16_v2.png"/>
+  <link rel="preconnect" href="https://fonts.googleapis.com">
+  <link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
+  <link href="https://fonts.googleapis.com/css2?family=Inter:wght@400;500;600;700&display=swap" rel="stylesheet">
+  <link rel="stylesheet" href="../../_static/css/theme.css" type="text/css" />
+  <link rel="stylesheet" href="../../_static/pygments.css" type="text/css" />
+  <link rel="stylesheet" href="../../_static/pygments.css" type="text/css" />
+  <link rel="stylesheet" href="../../_static/css/theme.css" type="text/css" />
+  <link rel="stylesheet" href="../../_static/css/custom.css" type="text/css" />
+  <link rel="stylesheet" href="../../_static/nbsphinx-code-cells.css" type="text/css" />
+
+  
+  
+  
+  
+
+  
+  <!--[if lt IE 9]>
+    <script src="../../_static/js/html5shiv.min.js"></script>
+  <![endif]-->
+  
+    
+      <script type="text/javascript" id="documentation_options" data-url_root="../../" src="../../_static/documentation_options.js"></script>
+        <script data-url_root="../../" id="documentation_options" src="../../_static/documentation_options.js"></script>
+        <script src="../../_static/doctools.js"></script>
+        <script src="../../_static/sphinx_highlight.js"></script>
+        <script crossorigin="anonymous" integrity="sha256-Ae2Vz/4ePdIu6ZyI/5ZGsYnb+m0JlOmKPjt6XZ9JJkA=" src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.4/require.min.js"></script>
+        <script>window.MathJax = {"tex": {"inlineMath": [["$", "$"], ["\\(", "\\)"]], "processEscapes": true}, "options": {"ignoreHtmlClass": "tex2jax_ignore|mathjax_ignore|document", "processHtmlClass": "tex2jax_process|mathjax_process|math|output_area"}}</script>
+        <script defer="defer" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+        <script data-domain="chanzuckerberg.github.io/cellxgene-census" defer="defer" src="https://plausible.io/js/script.js"></script>
+    
+    <script type="text/javascript" src="../../_static/js/theme.js"></script>
+
+    
+    <link rel="index" title="Index" href="../../genindex.html" />
+    <link rel="search" title="Search" href="../../search.html" />
+    <link rel="next" title="Querying data using the gget cellxgene module" href="census_gget_demo.html" />
+    <link rel="prev" title="Querying and fetching the single-cell data and cell/gene metadata." href="census_query_extract.html" /> 
+</head>
+
+<body class="wy-body-for-nav">
+
+  <div style="height: 100vh; overflow: hidden;">
+     
+    <!-- top 56px for navbar height -->
+    <div class="navbar-cxg">
+        <div style="padding: 0 16px; display: flex; height: inherit; align-items: center; justify-content: space-between;">
+            <span style="display:flex; gap: 32px; align-items: center;">
+                <a href="https://cellxgene.cziscience.com/">
+                  <img src="../../_static/img/cellxgene-discover-logo.svg" />
+                </a>
+                <span class="navbar-cxg-nav-wrapper">
+                  <span class="navbar-cxg-section">
+                    <span class="navbar-cxg-nav-section-title">Application</span>
+                    <span class="navbar-cxg-nav-item-container">
+                      <span class="navbar-cxg-link">
+                          <a class="navbar-cxg-anchor" href="https://cellxgene.cziscience.com/collections">Collections</a>
+                      </span>
+                      <span class="navbar-cxg-link">
+                          <a class="navbar-cxg-anchor" href="https://cellxgene.cziscience.com/datasets">Datasets</a>
+                      </span>
+                      <span class="navbar-cxg-link">
+                          <a class="navbar-cxg-anchor" href="https://cellxgene.cziscience.com/gene-expression">Gene Expression</a>
+                      </span>
+                      <span class="navbar-cxg-link">
+                        <a class="navbar-cxg-anchor" href="https://cellxgene.cziscience.com/cellguide">Cell Guide</a>
+                        <div style="height: 16px!important; display: flex;">
+                          <span class="beta">BETA</span>
+                        </div>
+                      </span>
+                    </span>
+                  </span>
+                  <hr class="navbar-divider"/>
+                  <span class="navbar-cxg-section">
+                    <span class="navbar-cxg-nav-section-title">Census</span>
+                    <span class="navbar-cxg-nav-item-container">
+                      <span class="navbar-cxg-link active-link">
+                        <a class="navbar-cxg-anchor" href="/cellxgene-census/index.html">API</a>
+                      </span>
+                      <span class="navbar-cxg-link">
+                        <a class="navbar-cxg-anchor" href="https://cellxgene.cziscience.com/census-models">Models</a>
+                      </span>
+                    </span>
+                  </span>
+                </span>
+            </span>
+
+            <span class="navbar-cxg-link">
+              <a class="navbar-cxg-anchor" href="https://cellxgene.cziscience.com/docs">Help & Documentation</a>
+            </span>
+        </div>
+    </div>
+    <div style="width: 100%; height: 100%; overflow: auto; padding-top: 56px;">
+        
+        <!-- top 56px for navbar height -->
+        <nav data-toggle="wy-nav-shift" class="wy-nav-side" style="top: 56px;" >
+        <div class="wy-side-scroll">
+            <div class="wy-side-nav-search" >
+            
+
+            
+                <a href="../../index.html" class="icon icon-home"> cellxgene-census
+            
+
+            
+            </a>
+
+            
+                
+                
+                <div class="version">
+                    v1.9.1
+                </div>
+                
+            
+
+            
+
+            
+            </div>
+
+            
+            <div class="wy-menu wy-menu-vertical" data-spy="affix" role="navigation" aria-label="main navigation">
+            
+                
+                
+                
+                
+                
+                <ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../../cellxgene_census_docsite_installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../cellxgene_census_docsite_quick_start.html">Quick start</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../articles.html">What’s new?</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../cellxgene_census_aws_open_data.html">Census in AWS ☁️</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../cellxgene_census_docsite_schema.html">Census data and schema</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../cellxgene_census_docsite_data_release_info.html">Census data releases</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../python-api.html">Python API</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="../../examples.html">Python tutorials</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="../../examples.html#exporting-data">Exporting data</a><ul class="current">
+<li class="toctree-l3"><a class="reference internal" href="../../cellxgene_census_docsite_quick_start.html">Quick start</a></li>
+<li class="toctree-l3"><a class="reference internal" href="census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata.</a></li>
+<li class="toctree-l3 current"><a class="current reference internal" href="#">Generating citations for Census slices</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="#Requirements">Requirements</a></li>
+<li class="toctree-l4"><a class="reference internal" href="#Generating-citation-strings">Generating citation strings</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="census_gget_demo.html">Querying data using the gget cellxgene module</a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="../../examples.html#new-using-integrated-embeddings-and-models">[NEW! 🚀] Using integrated embeddings and models</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../../examples.html#uderstanding-census-data">Uderstanding Census data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../../examples.html#analyzing-census-data">Analyzing Census data</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../../examples.html#scalable-computing">Scalable computing</a></li>
+<li class="toctree-l2"><a class="reference internal" href="../../examples.html#scalable-machine-learning">Scalable machine learning</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference external" href="https://chanzuckerberg.github.io/cellxgene-census/r/index.html">R API &amp; tutorials</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../cellxgene_census_docsite_FAQ.html">FAQ</a></li>
+</ul>
+
+                
+            
+            </div>
+            
+        </div>
+        </nav>
+
+        <section data-toggle="wy-nav-shift" class="wy-nav-content-wrap">
+
+        
+        <nav class="wy-nav-top" aria-label="top navigation">
+            
+            <i data-toggle="wy-nav-top" class="fa fa-bars"></i>
+            <a href="../../index.html">cellxgene-census</a>
+            
+        </nav>
+
+
+        <div class="wy-nav-content">
+            
+            <div class="rst-content">
+            
+            <div role="navigation" aria-label="Page navigation">
+  <ul class="wy-breadcrumbs">
+      <li><a href="../../index.html" class="icon icon-home" aria-label="Home"></a></li>
+          <li class="breadcrumb-item"><a href="../../examples.html">Python tutorials</a></li>
+      <li class="breadcrumb-item active">Generating citations for Census slices</li>
+      <li class="wy-breadcrumbs-aside">
+            <a href="../../_sources/notebooks/api_demo/census_citation_generation.ipynb.txt" rel="nofollow"> View page source</a>
+      </li>
+  </ul>
+  <hr/>
+</div>
+            <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
+            <div itemprop="articleBody">
+                
+  <section id="Generating-citations-for-Census-slices">
+<h1>Generating citations for Census slices<a class="headerlink" href="#Generating-citations-for-Census-slices" title="Permalink to this heading">¶</a></h1>
+<p>This notebook demonstrates how to generate a citation string for all datasets contained in a Census slice.</p>
+<p><strong>Contents</strong></p>
+<ol class="arabic simple">
+<li><p>Requirements</p></li>
+<li><p>Generating citation strings</p>
+<ol class="arabic simple">
+<li><p>Via cell metadata query</p></li>
+<li><p>Via an AnnData query</p></li>
+</ol>
+</li>
+</ol>
+<p>⚠️ Note that the Census RNA data includes duplicate cells present across multiple datasets. Duplicate cells can be filtered in or out using the cell metadata variable <code class="docutils literal notranslate"><span class="pre">is_primary_data</span></code> which is described in the <a class="reference external" href="https://github.com/chanzuckerberg/cellxgene-census/blob/main/docs/cellxgene_census_schema.md#repeated-data">Census schema</a>.</p>
+<section id="Requirements">
+<h2>Requirements<a class="headerlink" href="#Requirements" title="Permalink to this heading">¶</a></h2>
+<p>This notebook requires:</p>
+<ul class="simple">
+<li><p><code class="docutils literal notranslate"><span class="pre">cellxgene_census</span></code> Python package.</p></li>
+<li><p>Census data release with <a class="reference external" href="https://github.com/chanzuckerberg/cellxgene-census/blob/main/docs/cellxgene_census_schema.md">schema version</a> 1.3.0 or greater.</p></li>
+</ul>
+</section>
+<section id="Generating-citation-strings">
+<h2>Generating citation strings<a class="headerlink" href="#Generating-citation-strings" title="Permalink to this heading">¶</a></h2>
+<p>First we open a handle to the Census data. To ensure we open a data release with schema version 1.3.0 or greater, we use <code class="docutils literal notranslate"><span class="pre">census_version=&quot;latest&quot;</span></code></p>
+<div class="nbinput docutils container">
+<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[1]:
+</pre></div>
+</div>
+<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">import</span> <span class="nn">cellxgene_census</span>
+
+<span class="n">census</span> <span class="o">=</span> <span class="n">cellxgene_census</span><span class="o">.</span><span class="n">open_soma</span><span class="p">(</span><span class="n">census_version</span><span class="o">=</span><span class="s2">&quot;latest&quot;</span><span class="p">)</span>
+<span class="n">census</span><span class="p">[</span><span class="s2">&quot;census_info&quot;</span><span class="p">][</span><span class="s2">&quot;summary&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">read</span><span class="p">()</span><span class="o">.</span><span class="n">concat</span><span class="p">()</span><span class="o">.</span><span class="n">to_pandas</span><span class="p">()</span>
+</pre></div>
+</div>
+</div>
+<div class="nboutput nblast docutils container">
+<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[1]:
+</pre></div>
+</div>
+<div class="output_area rendered_html docutils container">
+<div>
+<style scoped>
+    .dataframe tbody tr th:only-of-type {
+        vertical-align: middle;
+    }
+
+    .dataframe tbody tr th {
+        vertical-align: top;
+    }
+
+    .dataframe thead th {
+        text-align: right;
+    }
+</style>
+<table border="1" class="dataframe">
+  <thead>
+    <tr style="text-align: right;">
+      <th></th>
+      <th>soma_joinid</th>
+      <th>label</th>
+      <th>value</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr>
+      <th>0</th>
+      <td>0</td>
+      <td>census_schema_version</td>
+      <td>1.3.0</td>
+    </tr>
+    <tr>
+      <th>1</th>
+      <td>1</td>
+      <td>census_build_date</td>
+      <td>2024-01-01</td>
+    </tr>
+    <tr>
+      <th>2</th>
+      <td>2</td>
+      <td>dataset_schema_version</td>
+      <td>4.0.0</td>
+    </tr>
+    <tr>
+      <th>3</th>
+      <td>3</td>
+      <td>total_cell_count</td>
+      <td>75694072</td>
+    </tr>
+    <tr>
+      <th>4</th>
+      <td>4</td>
+      <td>unique_cell_count</td>
+      <td>45846761</td>
+    </tr>
+    <tr>
+      <th>5</th>
+      <td>5</td>
+      <td>number_donors_homo_sapiens</td>
+      <td>16292</td>
+    </tr>
+    <tr>
+      <th>6</th>
+      <td>6</td>
+      <td>number_donors_mus_musculus</td>
+      <td>2153</td>
+    </tr>
+  </tbody>
+</table>
+</div></div>
+</div>
+<p>Then we load the dataset table which contains a column <code class="docutils literal notranslate"><span class="pre">&quot;citation&quot;</span></code> for each dataset included in Census.</p>
+<div class="nbinput docutils container">
+<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[2]:
+</pre></div>
+</div>
+<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">datasets</span> <span class="o">=</span> <span class="n">census</span><span class="p">[</span><span class="s2">&quot;census_info&quot;</span><span class="p">][</span><span class="s2">&quot;datasets&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">read</span><span class="p">()</span><span class="o">.</span><span class="n">concat</span><span class="p">()</span><span class="o">.</span><span class="n">to_pandas</span><span class="p">()</span>
+<span class="n">datasets</span><span class="p">[</span><span class="s2">&quot;citation&quot;</span><span class="p">]</span>
+</pre></div>
+</div>
+</div>
+<div class="nboutput nblast docutils container">
+<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[2]:
+</pre></div>
+</div>
+<div class="output_area docutils container">
+<div class="highlight"><pre>
+0      Dataset Version: https://datasets.cellxgene.cz...
+1      Dataset Version: https://datasets.cellxgene.cz...
+2      Dataset Version: https://datasets.cellxgene.cz...
+3      Dataset Version: https://datasets.cellxgene.cz...
+4      Publication: https://doi.org/10.1002/ctm2.1356...
+                             ...
+695    Publication: https://doi.org/10.1038/s41586-02...
+696    Publication: https://doi.org/10.1038/s41586-02...
+697    Publication: https://doi.org/10.1016/j.isci.20...
+698    Publication: https://doi.org/10.1371/journal.p...
+699    Publication: https://doi.org/10.1016/j.isci.20...
+Name: citation, Length: 700, dtype: object
+</pre></div></div>
+</div>
+<p>And now we can use the column <code class="docutils literal notranslate"><span class="pre">&quot;dataset_id&quot;</span></code> present in both the dataset table and the Census cell metadata to create citation strings for any Census slice.</p>
+<section id="Via-cell-metadata-query">
+<h3>Via cell metadata query<a class="headerlink" href="#Via-cell-metadata-query" title="Permalink to this heading">¶</a></h3>
+<div class="nbinput docutils container">
+<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[3]:
+</pre></div>
+</div>
+<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Query cell metadata</span>
+<span class="n">cell_metadata</span> <span class="o">=</span> <span class="n">census</span><span class="p">[</span><span class="s2">&quot;census_data&quot;</span><span class="p">][</span><span class="s2">&quot;homo_sapiens&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">obs</span><span class="o">.</span><span class="n">read</span><span class="p">(</span>
+    <span class="n">value_filter</span><span class="o">=</span><span class="s2">&quot;tissue == &#39;cardiac atrium&#39;&quot;</span><span class="p">,</span> <span class="n">column_names</span><span class="o">=</span><span class="p">[</span><span class="s2">&quot;dataset_id&quot;</span><span class="p">,</span> <span class="s2">&quot;cell_type&quot;</span><span class="p">]</span>
+<span class="p">)</span>
+<span class="n">cell_metadata</span> <span class="o">=</span> <span class="n">cell_metadata</span><span class="o">.</span><span class="n">concat</span><span class="p">()</span><span class="o">.</span><span class="n">to_pandas</span><span class="p">()</span>
+
+<span class="c1"># Get a citation string for the slice</span>
+<span class="n">slice_datasets</span> <span class="o">=</span> <span class="n">datasets</span><span class="p">[</span><span class="n">datasets</span><span class="p">[</span><span class="s2">&quot;dataset_id&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">cell_metadata</span><span class="p">[</span><span class="s2">&quot;dataset_id&quot;</span><span class="p">])]</span>
+<span class="nb">print</span><span class="p">(</span><span class="o">*</span><span class="n">slice_datasets</span><span class="p">[</span><span class="s2">&quot;citation&quot;</span><span class="p">],</span> <span class="n">sep</span><span class="o">=</span><span class="s2">&quot;</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</pre></div>
+</div>
+</div>
+<div class="nboutput nblast docutils container">
+<div class="prompt empty docutils container">
+</div>
+<div class="output_area docutils container">
+<div class="highlight"><pre>
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+</pre></div></div>
+</div>
+</section>
+<section id="Via-AnnData-query">
+<h3>Via AnnData query<a class="headerlink" href="#Via-AnnData-query" title="Permalink to this heading">¶</a></h3>
+<div class="nbinput docutils container">
+<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[4]:
+</pre></div>
+</div>
+<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Fetch an AnnData object</span>
+<span class="n">adata</span> <span class="o">=</span> <span class="n">cellxgene_census</span><span class="o">.</span><span class="n">get_anndata</span><span class="p">(</span>
+    <span class="n">census</span><span class="o">=</span><span class="n">census</span><span class="p">,</span>
+    <span class="n">organism</span><span class="o">=</span><span class="s2">&quot;homo_sapiens&quot;</span><span class="p">,</span>
+    <span class="n">measurement_name</span><span class="o">=</span><span class="s2">&quot;RNA&quot;</span><span class="p">,</span>
+    <span class="n">obs_value_filter</span><span class="o">=</span><span class="s2">&quot;tissue == &#39;cardiac atrium&#39;&quot;</span><span class="p">,</span>
+    <span class="n">var_value_filter</span><span class="o">=</span><span class="s2">&quot;feature_name == &#39;MYBPC3&#39;&quot;</span><span class="p">,</span>
+    <span class="n">column_names</span><span class="o">=</span><span class="p">{</span><span class="s2">&quot;obs&quot;</span><span class="p">:</span> <span class="p">[</span><span class="s2">&quot;dataset_id&quot;</span><span class="p">,</span> <span class="s2">&quot;cell_type&quot;</span><span class="p">]},</span>
+<span class="p">)</span>
+
+<span class="c1"># Get a citation string for the slice</span>
+<span class="n">slice_datasets</span> <span class="o">=</span> <span class="n">datasets</span><span class="p">[</span><span class="n">datasets</span><span class="p">[</span><span class="s2">&quot;dataset_id&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">adata</span><span class="o">.</span><span class="n">obs</span><span class="p">[</span><span class="s2">&quot;dataset_id&quot;</span><span class="p">])]</span>
+<span class="nb">print</span><span class="p">(</span><span class="o">*</span><span class="n">slice_datasets</span><span class="p">[</span><span class="s2">&quot;citation&quot;</span><span class="p">],</span> <span class="n">sep</span><span class="o">=</span><span class="s2">&quot;</span><span class="se">\n\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</pre></div>
+</div>
+</div>
+<div class="nboutput nblast docutils container">
+<div class="prompt empty docutils container">
+</div>
+<div class="output_area docutils container">
+<div class="highlight"><pre>
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+
+Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5
+</pre></div></div>
+</div>
+<p>And don’t forget to close the Census handle</p>
+<div class="nbinput nblast docutils container">
+<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[6]:
+</pre></div>
+</div>
+<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">census</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
+</pre></div>
+</div>
+</div>
+</section>
+</section>
+</section>
+
+
+            </div>
+            
+            </div>
+            <footer><div class="rst-footer-buttons" role="navigation" aria-label="Footer">
+        <a href="census_query_extract.html" class="btn btn-neutral float-left" title="Querying and fetching the single-cell data and cell/gene metadata." accesskey="p" rel="prev"><span class="fa fa-arrow-circle-left" aria-hidden="true"></span> Previous</a>
+        <a href="census_gget_demo.html" class="btn btn-neutral float-right" title="Querying data using the gget cellxgene module" accesskey="n" rel="next">Next <span class="fa fa-arrow-circle-right" aria-hidden="true"></span></a>
+    </div>
+
+  <hr/>
+
+  <div role="contentinfo">
+    <p>&#169; Copyright 2022-2023 Chan Zuckerberg Initiative Foundation.</p>
+  </div>
+
+  Built with <a href="https://www.sphinx-doc.org/">Sphinx</a> using a
+    <a href="https://github.com/readthedocs/sphinx_rtd_theme">theme</a>
+    provided by <a href="https://readthedocs.org">Read the Docs</a>.
+   
+
+</footer>
+            </div>
+        </div>
+
+        </section>
+
+    </div>
+    <!-- Newsletter Banner -->
+    <div role="banner" id="newsletter-banner">
+      <span id="newsletter-subscribe-button" role="button">Subscribe</span>&nbsp;to our newsletter to receive updates about new features.
+      <div id="newsletter-banner-close-button" role="button">X</div>
+    </div>
+    <!-- Newsletter Modal -->
+    <dialog id="newsletter-modal">
+      <div id="newsletter-header">
+        <img id="newsletter-logo" src="../../_static/img/cellxGene-newsletter-logo.svg" />
+        <div id="newsletter-close-button" role="button">X</div>
+      </div>
+      <div id="newsletter-content">
+        <div id="newsletter-callout">Join Our Newsletter</div>
+        <div id="newsletter-description">Get a quarterly email with the latest CELLxGENE features and data.</div>
+        <!-- HubSpot Form target -->
+        <div id="newsletter-form-container"></div>
+      </div>
+
+      <div id="newsletter-footnote">Unsubscribe at any time.</div>
+    </dialog>
+  </div>
+  
+
+  <script>
+    // (thuang): 30 days
+    const NEWSLETTER_BANNER_DISMISSED_TTL_MS = 30 * 24 * 60 * 60 * 1000;
+    const NEWSLETTER_BANNER_DISMISSED_KEY = "newsletterBannerDismissed"
+
+    var script = document.createElement('script');
+    script.src = 'https://js.hsforms.net/forms/v2.js';
+    script.defer = true;
+    document.head.appendChild(script);
+
+    // Run the code once the script is loaded
+    script.onload = async function() {
+      await hbspt.forms.create({
+        region: "na1",
+        portalId: "7272273",
+        formId: "eb65b811-0451-414d-8304-7b9b6f468ce5",
+        target: '#newsletter-form-container',
+        onFormReady() {
+          // get element by type "email"
+          const emailInput = document.querySelector('#email-eb65b811-0451-414d-8304-7b9b6f468ce5');
+          emailInput.setAttribute('placeholder', 'Enter email address');
+
+          // remove the label element for emailInput
+          const emailLabel = document.querySelector('#label-email-eb65b811-0451-414d-8304-7b9b6f468ce5');
+          emailLabel.remove();
+        },
+        submitText: 'Subscribe',
+      });
+    };
+
+    checkNewsletterBanner();
+
+    document.querySelector('#newsletter-banner-close-button').addEventListener('click', () => {
+      document.querySelector('#newsletter-banner').remove();
+      localStorage.setItem(NEWSLETTER_BANNER_DISMISSED_KEY, Date.now());
+    });
+
+    const modal = document.querySelector('#newsletter-modal');
+
+    document.querySelector('#newsletter-subscribe-button').addEventListener('click', () => {
+      modal.showModal();
+    });
+
+    document.querySelector('#newsletter-close-button').addEventListener('click', () => {
+      modal.close();
+    });
+
+    function checkNewsletterBanner() {
+      /**
+       * (thuang): Use LocalStorage to store dismissed state for 30 days
+       * NOTE: Currently Census doc page doesn't share the same domain as the main site,
+       * so dismissing the banner on the main site won't dismiss it on the Census doc page.
+       * And vice versa.
+       */
+      const newsletterBannerDismissed = localStorage.getItem('newsletterBannerDismissed');
+
+      if (newsletterBannerDismissed) {
+        return;
+      }
+
+      if (newsletterBannerDismissed && Date.now() - newsletterBannerDismissed > NEWSLETTER_BANNER_DISMISSED_TTL_MS) {
+        localStorage.removeItem(NEWSLETTER_BANNER_DISMISSED_KEY);
+      }
+
+      const newsletterBanner = document.querySelector('#newsletter-banner');
+
+      if (!newsletterBannerDismissed) {
+        newsletterBanner.style.display = 'flex';
+      }
+    }
+  </script>
+
+  
+  
+    
+   
+
+</body>
+</html>
\ No newline at end of file
diff --git a/notebooks/api_demo/census_citation_generation.ipynb b/notebooks/api_demo/census_citation_generation.ipynb
new file mode 100644
index 000000000..f716d170a
--- /dev/null
+++ b/notebooks/api_demo/census_citation_generation.ipynb
@@ -0,0 +1,310 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "id": "88812eae-6b46-48b4-a1e4-c468657d8480",
+   "metadata": {},
+   "source": [
+    "# Generating citations for Census slices\n",
+    "\n",
+    "This notebook demonstrates how to generate a citation string for all datasets contained in a Census slice.\n",
+    "\n",
+    "**Contents**\n",
+    "\n",
+    "1. Requirements\n",
+    "1. Generating citation strings\n",
+    "   1. Via cell metadata query\n",
+    "   1. Via an AnnData query \n",
+    "\n",
+    "⚠️ Note that the Census RNA data includes duplicate cells present across multiple datasets. Duplicate cells can be filtered in or out using the cell metadata variable `is_primary_data` which is described in the [Census schema](https://github.com/chanzuckerberg/cellxgene-census/blob/main/docs/cellxgene_census_schema.md#repeated-data).\n",
+    "\n",
+    "## Requirements\n",
+    "\n",
+    "This notebook requires:\n",
+    "\n",
+    "- `cellxgene_census` Python package.\n",
+    "- Census data release with [schema version](https://github.com/chanzuckerberg/cellxgene-census/blob/main/docs/cellxgene_census_schema.md) 1.3.0 or greater.\n",
+    "\n",
+    "## Generating citation strings\n",
+    "\n",
+    "First we open a handle to the Census data. To ensure we open a data release with schema version 1.3.0 or greater, we use `census_version=\"latest\"`"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 1,
+   "id": "9a5a5a92-3d78-4542-95a5-e6889f245491",
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>soma_joinid</th>\n",
+       "      <th>label</th>\n",
+       "      <th>value</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>0</td>\n",
+       "      <td>census_schema_version</td>\n",
+       "      <td>1.3.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>1</td>\n",
+       "      <td>census_build_date</td>\n",
+       "      <td>2024-01-01</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>2</td>\n",
+       "      <td>dataset_schema_version</td>\n",
+       "      <td>4.0.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>3</td>\n",
+       "      <td>total_cell_count</td>\n",
+       "      <td>75694072</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>4</td>\n",
+       "      <td>unique_cell_count</td>\n",
+       "      <td>45846761</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>5</th>\n",
+       "      <td>5</td>\n",
+       "      <td>number_donors_homo_sapiens</td>\n",
+       "      <td>16292</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>6</th>\n",
+       "      <td>6</td>\n",
+       "      <td>number_donors_mus_musculus</td>\n",
+       "      <td>2153</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "   soma_joinid                       label       value\n",
+       "0            0       census_schema_version       1.3.0\n",
+       "1            1           census_build_date  2024-01-01\n",
+       "2            2      dataset_schema_version       4.0.0\n",
+       "3            3            total_cell_count    75694072\n",
+       "4            4           unique_cell_count    45846761\n",
+       "5            5  number_donors_homo_sapiens       16292\n",
+       "6            6  number_donors_mus_musculus        2153"
+      ]
+     },
+     "execution_count": 1,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "import cellxgene_census\n",
+    "\n",
+    "census = cellxgene_census.open_soma(census_version=\"latest\")\n",
+    "census[\"census_info\"][\"summary\"].read().concat().to_pandas()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "23174644-7804-4723-a4ab-c5cf75bdd954",
+   "metadata": {},
+   "source": [
+    "Then we load the dataset table which contains a column `\"citation\"` for each dataset included in Census. "
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "id": "d47b636a-d653-4e3b-b139-14b6ca697ce8",
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "0      Dataset Version: https://datasets.cellxgene.cz...\n",
+       "1      Dataset Version: https://datasets.cellxgene.cz...\n",
+       "2      Dataset Version: https://datasets.cellxgene.cz...\n",
+       "3      Dataset Version: https://datasets.cellxgene.cz...\n",
+       "4      Publication: https://doi.org/10.1002/ctm2.1356...\n",
+       "                             ...                        \n",
+       "695    Publication: https://doi.org/10.1038/s41586-02...\n",
+       "696    Publication: https://doi.org/10.1038/s41586-02...\n",
+       "697    Publication: https://doi.org/10.1016/j.isci.20...\n",
+       "698    Publication: https://doi.org/10.1371/journal.p...\n",
+       "699    Publication: https://doi.org/10.1016/j.isci.20...\n",
+       "Name: citation, Length: 700, dtype: object"
+      ]
+     },
+     "execution_count": 2,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "datasets = census[\"census_info\"][\"datasets\"].read().concat().to_pandas()\n",
+    "datasets[\"citation\"]"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "06adfa4a-3656-4f26-9adf-ba28eb2f691e",
+   "metadata": {},
+   "source": [
+    "And now we can use the column `\"dataset_id\"` present in both the dataset table and the Census cell metadata to create citation strings for any Census slice.\n",
+    "\n",
+    "### Via cell metadata query"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "id": "f7edf4a7-8394-4df2-9dde-b24efcd6dbe0",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n"
+     ]
+    }
+   ],
+   "source": [
+    "# Query cell metadata\n",
+    "cell_metadata = census[\"census_data\"][\"homo_sapiens\"].obs.read(\n",
+    "    value_filter=\"tissue == 'cardiac atrium'\", column_names=[\"dataset_id\", \"cell_type\"]\n",
+    ")\n",
+    "cell_metadata = cell_metadata.concat().to_pandas()\n",
+    "\n",
+    "# Get a citation string for the slice\n",
+    "slice_datasets = datasets[datasets[\"dataset_id\"].isin(cell_metadata[\"dataset_id\"])]\n",
+    "print(*slice_datasets[\"citation\"], sep=\"\\n\\n\")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "941c6f2d-6bc2-46c3-963e-e74335fe93f6",
+   "metadata": {},
+   "source": [
+    "### Via AnnData query"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 4,
+   "id": "2d9b2a11-2f48-43a5-8955-759019ce6bed",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n",
+      "\n",
+      "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\n"
+     ]
+    }
+   ],
+   "source": [
+    "# Fetch an AnnData object\n",
+    "adata = cellxgene_census.get_anndata(\n",
+    "    census=census,\n",
+    "    organism=\"homo_sapiens\",\n",
+    "    measurement_name=\"RNA\",\n",
+    "    obs_value_filter=\"tissue == 'cardiac atrium'\",\n",
+    "    var_value_filter=\"feature_name == 'MYBPC3'\",\n",
+    "    column_names={\"obs\": [\"dataset_id\", \"cell_type\"]},\n",
+    ")\n",
+    "\n",
+    "# Get a citation string for the slice\n",
+    "slice_datasets = datasets[datasets[\"dataset_id\"].isin(adata.obs[\"dataset_id\"])]\n",
+    "print(*slice_datasets[\"citation\"], sep=\"\\n\\n\")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "f6988186-5294-43f9-bfe5-2ac255aa0b26",
+   "metadata": {},
+   "source": [
+    "And don't forget to close the Census handle"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 6,
+   "id": "f96b1c3b-4a2a-469a-9ded-1c5ff98b84aa",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "census.close()"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3 (ipykernel)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.11.4"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 5
+}
diff --git a/notebooks/api_demo/census_gget_demo.html b/notebooks/api_demo/census_gget_demo.html
index 43e85c7a5..ba4d19159 100644
--- a/notebooks/api_demo/census_gget_demo.html
+++ b/notebooks/api_demo/census_gget_demo.html
@@ -50,7 +50,7 @@
     <link rel="index" title="Index" href="../../genindex.html" />
     <link rel="search" title="Search" href="../../search.html" />
     <link rel="next" title="Access CELLxGENE collaboration embeddings (scVI, Geneformer)" href="census_access_maintained_embeddings.html" />
-    <link rel="prev" title="Querying and fetching the single-cell data and cell/gene metadata." href="census_query_extract.html" /> 
+    <link rel="prev" title="Generating citations for Census slices" href="census_citation_generation.html" /> 
 </head>
 
 <body class="wy-body-for-nav">
@@ -154,6 +154,7 @@
 <li class="toctree-l2 current"><a class="reference internal" href="../../examples.html#exporting-data">Exporting data</a><ul class="current">
 <li class="toctree-l3"><a class="reference internal" href="../../cellxgene_census_docsite_quick_start.html">Quick start</a></li>
 <li class="toctree-l3"><a class="reference internal" href="census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata.</a></li>
+<li class="toctree-l3"><a class="reference internal" href="census_citation_generation.html">Generating citations for Census slices</a></li>
 <li class="toctree-l3 current"><a class="current reference internal" href="#">Querying data using the gget cellxgene module</a><ul>
 <li class="toctree-l4"><a class="reference internal" href="#Install-gget-and-set-up-cellxgene-module">Install gget and set up cellxgene module</a></li>
 <li class="toctree-l4"><a class="reference internal" href="#Fetch-an-AnnData-object-by-selecting-gene(s),-tissue(s)-and-cell-type(s)">Fetch an AnnData object by selecting gene(s), tissue(s) and cell type(s)</a></li>
@@ -869,7 +870,7 @@ <h2>Use <a class="reference external" href="https://pachterlab.github.io/gget/ce
             
             </div>
             <footer><div class="rst-footer-buttons" role="navigation" aria-label="Footer">
-        <a href="census_query_extract.html" class="btn btn-neutral float-left" title="Querying and fetching the single-cell data and cell/gene metadata." accesskey="p" rel="prev"><span class="fa fa-arrow-circle-left" aria-hidden="true"></span> Previous</a>
+        <a href="census_citation_generation.html" class="btn btn-neutral float-left" title="Generating citations for Census slices" accesskey="p" rel="prev"><span class="fa fa-arrow-circle-left" aria-hidden="true"></span> Previous</a>
         <a href="census_access_maintained_embeddings.html" class="btn btn-neutral float-right" title="Access CELLxGENE collaboration embeddings (scVI, Geneformer)" accesskey="n" rel="next">Next <span class="fa fa-arrow-circle-right" aria-hidden="true"></span></a>
     </div>
 
diff --git a/notebooks/api_demo/census_query_extract.html b/notebooks/api_demo/census_query_extract.html
index dde6cc8d8..130847bb4 100644
--- a/notebooks/api_demo/census_query_extract.html
+++ b/notebooks/api_demo/census_query_extract.html
@@ -49,7 +49,7 @@
     
     <link rel="index" title="Index" href="../../genindex.html" />
     <link rel="search" title="Search" href="../../search.html" />
-    <link rel="next" title="Querying data using the gget cellxgene module" href="census_gget_demo.html" />
+    <link rel="next" title="Generating citations for Census slices" href="census_citation_generation.html" />
     <link rel="prev" title="Python tutorials" href="../../examples.html" /> 
 </head>
 
@@ -160,6 +160,7 @@
 <li class="toctree-l4"><a class="reference internal" href="#Querying-gene-metadata-(var)">Querying gene metadata (var)</a></li>
 </ul>
 </li>
+<li class="toctree-l3"><a class="reference internal" href="census_citation_generation.html">Generating citations for Census slices</a></li>
 <li class="toctree-l3"><a class="reference internal" href="census_gget_demo.html">Querying data using the gget cellxgene module</a></li>
 </ul>
 </li>
@@ -1077,7 +1078,7 @@ <h2>Querying gene metadata (var)<a class="headerlink" href="#Querying-gene-metad
             </div>
             <footer><div class="rst-footer-buttons" role="navigation" aria-label="Footer">
         <a href="../../examples.html" class="btn btn-neutral float-left" title="Python tutorials" accesskey="p" rel="prev"><span class="fa fa-arrow-circle-left" aria-hidden="true"></span> Previous</a>
-        <a href="census_gget_demo.html" class="btn btn-neutral float-right" title="Querying data using the gget cellxgene module" accesskey="n" rel="next">Next <span class="fa fa-arrow-circle-right" aria-hidden="true"></span></a>
+        <a href="census_citation_generation.html" class="btn btn-neutral float-right" title="Generating citations for Census slices" accesskey="n" rel="next">Next <span class="fa fa-arrow-circle-right" aria-hidden="true"></span></a>
     </div>
 
   <hr/>
diff --git a/notebooks/experimental/pytorch.ipynb b/notebooks/experimental/pytorch.ipynb
index 060c7600d..5a1ebd44f 100644
--- a/notebooks/experimental/pytorch.ipynb
+++ b/notebooks/experimental/pytorch.ipynb
@@ -118,7 +118,7 @@
   },
   {
    "cell_type": "markdown",
-   "id": "c489b935",
+   "id": "d15bd4ae",
    "metadata": {
     "collapsed": false
    },
@@ -130,7 +130,7 @@
   },
   {
    "cell_type": "markdown",
-   "id": "dce7fd38",
+   "id": "fd80201e",
    "metadata": {
     "collapsed": false
    },
diff --git a/objects.inv b/objects.inv
index d2f21002f..d82299ac0 100644
Binary files a/objects.inv and b/objects.inv differ
diff --git a/python-api.html b/python-api.html
index a64b2fb37..6a75882b2 100644
--- a/python-api.html
+++ b/python-api.html
@@ -262,7 +262,7 @@ <h2>Get slice as AnnData<a class="headerlink" href="#get-slice-as-anndata" title
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="_autosummary/cellxgene_census.get_anndata.html#cellxgene_census.get_anndata" title="cellxgene_census.get_anndata"><code class="xref py py-obj docutils literal notranslate"><span class="pre">cellxgene_census.get_anndata</span></code></a></p></td>
-<td><p>Convience wrapper around <code class="docutils literal notranslate"><span class="pre">soma.Experiment</span></code> query, to build and execute a query, and return it as an <a class="reference external" href="https://anndata.readthedocs.io/en/latest/generated/anndata.AnnData.html#anndata.AnnData" title="(in anndata v0.11.0.dev37+g63e6b29)"><code class="xref py py-class docutils literal notranslate"><span class="pre">anndata.AnnData</span></code></a> object.</p></td>
+<td><p>Convience wrapper around <code class="docutils literal notranslate"><span class="pre">soma.Experiment</span></code> query, to build and execute a query, and return it as an <a class="reference external" href="https://anndata.readthedocs.io/en/latest/generated/anndata.AnnData.html#anndata.AnnData" title="(in anndata v0.11.0.dev40+g2abc89a)"><code class="xref py py-class docutils literal notranslate"><span class="pre">anndata.AnnData</span></code></a> object.</p></td>
 </tr>
 </tbody>
 </table>
diff --git a/r/404.html b/r/404.html
index 49abd43f4..e0cc8d957 100644
--- a/r/404.html
+++ b/r/404.html
@@ -59,6 +59,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
diff --git a/r/LICENSE-text.html b/r/LICENSE-text.html
index 5e463f673..9d4f1659a 100644
--- a/r/LICENSE-text.html
+++ b/r/LICENSE-text.html
@@ -38,6 +38,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
diff --git a/r/LICENSE.html b/r/LICENSE.html
index 767db8e5e..df5d8b422 100644
--- a/r/LICENSE.html
+++ b/r/LICENSE.html
@@ -38,6 +38,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
diff --git a/r/articles/census_access_maintained_embeddings.html b/r/articles/census_access_maintained_embeddings.html
index 97a6050d6..94420e491 100644
--- a/r/articles/census_access_maintained_embeddings.html
+++ b/r/articles/census_access_maintained_embeddings.html
@@ -61,6 +61,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -132,7 +133,7 @@ <h2 id="load-embeddings-as-seurat-reductions">Load embeddings as Seurat reductio
 <code class="sourceCode R"><span><span class="va">seurat_obj</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/RunUMAP.html" class="external-link">RunUMAP</a></span><span class="op">(</span></span>
 <span>  <span class="va">seurat_obj</span>, </span>
 <span>  reduction <span class="op">=</span> <span class="st">"scvi"</span>,</span>
-<span>  dims<span class="op">=</span><span class="fl">1</span><span class="op">:</span><span class="fu"><a href="https://rdrr.io/r/base/nrow.html" class="external-link">ncol</a></span><span class="op">(</span><span class="fu"><a href="https://mojaveazure.github.io/seurat-object/reference/Embeddings.html" class="external-link">Embeddings</a></span><span class="op">(</span><span class="va">seurat_obj</span>, <span class="st">"scvi"</span><span class="op">)</span><span class="op">)</span></span>
+<span>  dims<span class="op">=</span><span class="fl">1</span><span class="op">:</span><span class="fu"><a href="https://rdrr.io/r/base/nrow.html" class="external-link">ncol</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/pkg/SeuratObject/man/Embeddings.html" class="external-link">Embeddings</a></span><span class="op">(</span><span class="va">seurat_obj</span>, <span class="st">"scvi"</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="op">)</span></span>
 <span></span>
 <span><span class="fu"><a href="https://satijalab.org/seurat/reference/DimPlot.html" class="external-link">DimPlot</a></span><span class="op">(</span><span class="va">seurat_obj</span>, reduction <span class="op">=</span> <span class="st">"umap"</span>, group.by <span class="op">=</span> <span class="st">"cell_type"</span><span class="op">)</span> <span class="op">+</span></span>
diff --git a/r/articles/census_citation_generation.html b/r/articles/census_citation_generation.html
new file mode 100644
index 000000000..247eef148
--- /dev/null
+++ b/r/articles/census_citation_generation.html
@@ -0,0 +1,251 @@
+<!DOCTYPE html>
+<!-- Generated by pkgdown: do not edit by hand --><html lang="en">
+<head>
+<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
+<meta charset="utf-8">
+<meta http-equiv="X-UA-Compatible" content="IE=edge">
+<meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no">
+<meta name="description" content="cellxgene.census">
+<title>Generating citations for Census slices • cellxgene.census</title>
+<!-- favicons --><link rel="icon" type="image/png" sizes="16x16" href="../favicon-16x16.png">
+<link rel="icon" type="image/png" sizes="32x32" href="../favicon-32x32.png">
+<link rel="apple-touch-icon" type="image/png" sizes="180x180" href="../apple-touch-icon.png">
+<link rel="apple-touch-icon" type="image/png" sizes="120x120" href="../apple-touch-icon-120x120.png">
+<link rel="apple-touch-icon" type="image/png" sizes="76x76" href="../apple-touch-icon-76x76.png">
+<link rel="apple-touch-icon" type="image/png" sizes="60x60" href="../apple-touch-icon-60x60.png">
+<script src="../deps/jquery-3.6.0/jquery-3.6.0.min.js"></script><meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no">
+<link href="../deps/bootstrap-5.3.1/bootstrap.min.css" rel="stylesheet">
+<script src="../deps/bootstrap-5.3.1/bootstrap.bundle.min.js"></script><!-- Font Awesome icons --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/all.min.css" integrity="sha256-mmgLkCYLUQbXn0B1SRqzHar6dCnv9oZFPEC1g1cwlkk=" crossorigin="anonymous">
+<link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/v4-shims.min.css" integrity="sha256-wZjR52fzng1pJHwx4aV2AO3yyTOXrcDW7jBpJtTwVxw=" crossorigin="anonymous">
+<!-- bootstrap-toc --><script src="https://cdn.jsdelivr.net/gh/afeld/bootstrap-toc@v1.0.1/dist/bootstrap-toc.min.js" integrity="sha256-4veVQbu7//Lk5TSmc7YV48MxtMy98e26cf5MrgZYnwo=" crossorigin="anonymous"></script><!-- headroom.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/headroom.min.js" integrity="sha256-AsUX4SJE1+yuDu5+mAVzJbuYNPHj/WroHuZ8Ir/CkE0=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/jQuery.headroom.min.js" integrity="sha256-ZX/yNShbjqsohH1k95liqY9Gd8uOiE1S4vZc+9KQ1K4=" crossorigin="anonymous"></script><!-- clipboard.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/clipboard.js/2.0.6/clipboard.min.js" integrity="sha256-inc5kl9MA1hkeYUt+EC3BhlIgyp/2jDIyBLS6k3UxPI=" crossorigin="anonymous"></script><!-- search --><script src="https://cdnjs.cloudflare.com/ajax/libs/fuse.js/6.4.6/fuse.js" integrity="sha512-zv6Ywkjyktsohkbp9bb45V6tEMoWhzFzXis+LrMehmJZZSys19Yxf1dopHx7WzIKxr5tK2dVcYmaCk2uqdjF4A==" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/autocomplete.js/0.38.0/autocomplete.jquery.min.js" integrity="sha512-GU9ayf+66Xx2TmpxqJpliWbT5PiGYxpaG8rfnBEk1LL8l1KGkRShhngwdXK1UgqhAzWpZHSiYPc09/NwDQIGyg==" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/mark.js/8.11.1/mark.min.js" integrity="sha512-5CYOlHXGh6QpOFA/TeTylKLWfB3ftPsde7AnmhuitiTX4K5SqCLBeKro6sPS8ilsz1Q4NRx3v8Ko2IBiszzdww==" crossorigin="anonymous"></script><!-- pkgdown --><script src="../pkgdown.js"></script><meta property="og:title" content="Generating citations for Census slices">
+<meta property="og:description" content="cellxgene.census">
+<!-- mathjax --><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/MathJax.js" integrity="sha256-nvJJv9wWKEm88qvoQl9ekL2J+k/RWIsaSScxxlsrv8k=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/config/TeX-AMS-MML_HTMLorMML.js" integrity="sha256-84DKXVJXs0/F8OTMzX4UR909+jtl4G7SPypPavF+GfA=" crossorigin="anonymous"></script><!--[if lt IE 9]>
+<script src="https://oss.maxcdn.com/html5shiv/3.7.3/html5shiv.min.js"></script>
+<script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
+<![endif]--><script defer data-domain="chanzuckerberg.github.io/cellxgene-census" src="https://plausible.io/js/script.js"></script>
+</head>
+<body>
+    <a href="#main" class="visually-hidden-focusable">Skip to contents</a>
+    
+
+    <nav class="navbar fixed-top navbar-light navbar-expand-lg bg-light"><div class="container">
+    
+    <a class="navbar-brand me-2" href="../index.html">cellxgene.census</a>
+
+    <small class="nav-text text-muted me-auto" data-bs-toggle="tooltip" data-bs-placement="bottom" title="">1.9.1</small>
+
+    
+    <button class="navbar-toggler" type="button" data-bs-toggle="collapse" data-bs-target="#navbar" aria-controls="navbar" aria-expanded="false" aria-label="Toggle navigation">
+      <span class="navbar-toggler-icon"></span>
+    </button>
+
+    <div id="navbar" class="collapse navbar-collapse ms-3">
+      <ul class="navbar-nav me-auto">
+<li class="nav-item">
+  <a class="external-link nav-link" href="https://chanzuckerberg.github.io/cellxgene-census/">Main Census Site</a>
+</li>
+<li class="nav-item">
+  <a class="nav-link" href="../reference/index.html">Reference</a>
+</li>
+<li class="active nav-item dropdown">
+  <a href="#" class="nav-link dropdown-toggle" data-bs-toggle="dropdown" role="button" aria-expanded="false" aria-haspopup="true" id="dropdown-articles">Articles</a>
+  <div class="dropdown-menu" aria-labelledby="dropdown-articles">
+    <h6 class="dropdown-header" data-toc-skip>Use Census embeddings</h6>
+    <a class="dropdown-item" href="../articles/census_access_maintained_embeddings.html">Access CELLxGENE collaboration embeddings (scVI, Geneformer)</a>
+    <div class="dropdown-divider"></div>
+    <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
+    <a class="dropdown-item" href="../articles/comp_bio_census_info.html">Learning about the CZ CELLxGENE Census</a>
+    <a class="dropdown-item" href="../articles/comp_bio_summarize_axis_query.html">Summarizing cell and gene metadata</a>
+    <a class="dropdown-item" href="../articles/comp_bio_data_integration.html">Integrating multi-dataset slices of data with Seurat</a>
+    <a class="dropdown-item" href="../articles/comp_bio_normalizing_full_gene_sequencing.html">Normalizing full-length gene sequencing data</a>
+    <div class="dropdown-divider"></div>
+    <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
+    <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
+    <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
+    <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
+    <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
+    <a class="dropdown-item" href="../articles/census_access_maintained_embeddings.html">Access CELLxGENE collaboration embeddings (scVI, Geneformer)</a>
+  </div>
+</li>
+      </ul>
+<form class="form-inline my-2 my-lg-0" role="search">
+        <input type="search" class="form-control me-sm-2" aria-label="Toggle navigation" name="search-input" data-search-index="../search.json" id="search-input" placeholder="Search for" autocomplete="off">
+</form>
+
+      <ul class="navbar-nav">
+<li class="nav-item">
+  <a class="external-link nav-link" href="https://github.com/chanzuckerberg/cellxgene-census/" aria-label="github">
+    <span class="fab fa fab fa-github fa-lg"></span>
+     
+  </a>
+</li>
+      </ul>
+</div>
+
+    
+  </div>
+</nav><div class="container template-article">
+
+<div class="row">
+  <main id="main" class="col-md-9"><div class="page-header">
+      <img src="" class="logo" alt=""><h1>Generating citations for Census slices</h1>
+            
+      
+      <small class="dont-index">Source: <a href="https://github.com/chanzuckerberg/cellxgene-census/tree/main/api/r/cellxgene.census/vignettes_/census_citation_generation.Rmd" class="external-link"><code>vignettes/census_citation_generation.Rmd</code></a></small>
+      <div class="d-none name"><code>census_citation_generation.Rmd</code></div>
+    </div>
+
+    
+    
+<p>This notebook demonstrates how to generate a citation string for all datasets contained in a census slice.</p>
+<p><strong>Contents</strong></p>
+<ol style="list-style-type: decimal">
+<li>Requirements</li>
+<li>Generating citation strings
+<ol style="list-style-type: decimal">
+<li>Via cell metadata query</li>
+<li>Via Seurat query</li>
+<li>Via SingleCellExperiment query</li>
+</ol>
+</li>
+</ol>
+<p>⚠️ Note that the Census RNA data includes duplicate cells present across multiple datasets. Duplicate cells can be filtered in or out using the cell metadata variable <code>is_primary_data</code> which is described in the <a href="https://github.com/chanzuckerberg/cellxgene-census/blob/main/docs/cellxgene_census_schema.md#repeated-data" class="external-link">Census schema</a>.</p>
+<div class="section level2">
+<h2 id="requirements">Requirements<a class="anchor" aria-label="anchor" href="#requirements"></a>
+</h2>
+<p>This notebook requires:</p>
+<ul>
+<li>
+<code>cellxgene_census</code> Python package.</li>
+<li>Census data release with <a href="https://github.com/chanzuckerberg/cellxgene-census/blob/main/docs/cellxgene_census_schema.md" class="external-link">schema version</a> 1.3.0 or greater.</li>
+</ul>
+</div>
+<div class="section level2">
+<h2 id="generating-citation-strings">Generating citation strings<a class="anchor" aria-label="anchor" href="#generating-citation-strings"></a>
+</h2>
+<p>First we open a handle to the Census data. To ensure we open a data release with schema version 1.3.0 or greater, we use <code>census_version="latest"</code></p>
+<div class="sourceCode" id="cb1"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="st"><a href="https://github.com/TileDB-Inc/TileDB-R" class="external-link">"tiledb"</a></span><span class="op">)</span></span>
+<span><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="st"><a href="https://github.com/chanzuckerberg/cellxgene-census" class="external-link">"cellxgene.census"</a></span><span class="op">)</span></span>
+<span></span>
+<span><span class="va">census</span> <span class="op">&lt;-</span> <span class="fu"><a href="../reference/open_soma.html">open_soma</a></span><span class="op">(</span>census_version <span class="op">=</span> <span class="st">"latest"</span><span class="op">)</span></span>
+<span><span class="va">census_release_info</span> <span class="op">&lt;-</span> <span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_info"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"summary"</span><span class="op">)</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span><span class="op">)</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span></span>
+<span><span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">census_release_info</span><span class="op">)</span></span>
+<span><span class="co">#&gt;   soma_joinid                      label      value</span></span>
+<span><span class="co">#&gt; 1           0      census_schema_version      1.3.0</span></span>
+<span><span class="co">#&gt; 2           1          census_build_date 2024-01-01</span></span>
+<span><span class="co">#&gt; 3           2     dataset_schema_version      4.0.0</span></span>
+<span><span class="co">#&gt; 4           3           total_cell_count   75694072</span></span>
+<span><span class="co">#&gt; 5           4          unique_cell_count   45846761</span></span>
+<span><span class="co">#&gt; 6           5 number_donors_homo_sapiens      16292</span></span>
+<span><span class="co">#&gt; 7           6 number_donors_mus_musculus       2153</span></span></code></pre></div>
+<p>Then we load the dataset table which contains a column <code>"citation"</code> for each dataset included in Census.</p>
+<div class="sourceCode" id="cb2"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">datasets</span> <span class="op">&lt;-</span> <span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_info"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"datasets"</span><span class="op">)</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span><span class="op">)</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span></span>
+<span><span class="va">datasets</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">datasets</span><span class="op">)</span></span>
+<span><span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="va">datasets</span><span class="op">[</span><span class="st">"citation"</span><span class="op">]</span><span class="op">)</span></span>
+<span><span class="co">#&gt;                                                                                                                                                                                                                                                                                                citation</span></span>
+<span><span class="co">#&gt; 1                                                Dataset Version: https://datasets.cellxgene.cziscience.com/4fb3f166-6526-4a3d-b87f-b1cdc545b0f1.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/a0c84e3f-a5ca-4481-b3a5-ccfda0a81ecc</span></span>
+<span><span class="co">#&gt; 2                                                Dataset Version: https://datasets.cellxgene.cziscience.com/9edb54c2-3fe0-4a7a-bd62-a98e98299c5d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/a0c84e3f-a5ca-4481-b3a5-ccfda0a81ecc</span></span>
+<span><span class="co">#&gt; 3                                                Dataset Version: https://datasets.cellxgene.cziscience.com/0f88d425-2e51-4ecf-903a-921255537466.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/a0c84e3f-a5ca-4481-b3a5-ccfda0a81ecc</span></span>
+<span><span class="co">#&gt; 4                                                Dataset Version: https://datasets.cellxgene.cziscience.com/55c48748-ab69-457b-b9da-1858559f24f4.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/a0c84e3f-a5ca-4481-b3a5-ccfda0a81ecc</span></span>
+<span><span class="co">#&gt; 5 Publication: https://doi.org/10.1002/ctm2.1356 Dataset Version: https://datasets.cellxgene.cziscience.com/0574142b-eeb5-41e4-8d69-b613fd63e67b.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/7dd599c5-d25d-40c0-b1a6-8789791ca808</span></span>
+<span><span class="co">#&gt; 6 Publication: https://doi.org/10.1002/ctm2.1356 Dataset Version: https://datasets.cellxgene.cziscience.com/507380ee-ba43-4f9a-a5c6-aea27ddb48cb.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/7dd599c5-d25d-40c0-b1a6-8789791ca808</span></span></code></pre></div>
+<p>And now we can use the column <code>"dataset_id"</code> present in both the dataset table and the Census cell metadata to create citation strings for any Census slice.</p>
+<div class="section level3">
+<h3 id="via-cell-metadata-query">Via cell metadata query<a class="anchor" aria-label="anchor" href="#via-cell-metadata-query"></a>
+</h3>
+<div class="sourceCode" id="cb3"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="co"># Query cell metadata</span></span>
+<span><span class="va">cell_metadata</span> <span class="op">&lt;-</span> <span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_data"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"homo_sapiens"</span><span class="op">)</span><span class="op">$</span><span class="va">obs</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span></span>
+<span>    value_filter <span class="op">=</span> <span class="st">"tissue == 'cardiac atrium'"</span>,</span>
+<span>    column_names <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"dataset_id"</span>, <span class="st">"cell_type"</span><span class="op">)</span></span>
+<span><span class="op">)</span></span>
+<span></span>
+<span><span class="va">cell_metadata</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">cell_metadata</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span><span class="op">)</span></span>
+<span></span>
+<span><span class="co"># Get a citation string for the slice</span></span>
+<span><span class="va">slice_datasets</span> <span class="op">=</span> <span class="va">datasets</span><span class="op">[</span><span class="va">datasets</span><span class="op">$</span><span class="va">dataset_id</span>  <span class="op"><a href="https://rdrr.io/r/base/match.html" class="external-link">%in%</a></span> <span class="va">cell_metadata</span><span class="op">$</span><span class="va">dataset_id</span>,<span class="op">]</span></span>
+<span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="va">slice_datasets</span><span class="op">$</span><span class="va">citation</span><span class="op">)</span></span>
+<span><span class="co">#&gt; [1] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [2] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [3] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [4] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [5] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [6] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span></code></pre></div>
+</div>
+<div class="section level3">
+<h3 id="via-seurat-query">Via Seurat query<a class="anchor" aria-label="anchor" href="#via-seurat-query"></a>
+</h3>
+<div class="sourceCode" id="cb4"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="co"># Fetch a Seurat object</span></span>
+<span><span class="va">seurat_obj</span> <span class="op">&lt;-</span> <span class="fu"><a href="../reference/get_seurat.html">get_seurat</a></span><span class="op">(</span></span>
+<span>    census <span class="op">=</span> <span class="va">census</span>,</span>
+<span>    organism <span class="op">=</span> <span class="st">"homo_sapiens"</span>,</span>
+<span>    measurement_name <span class="op">=</span> <span class="st">"RNA"</span>,</span>
+<span>    obs_value_filter <span class="op">=</span> <span class="st">"tissue == 'cardiac atrium'"</span>,</span>
+<span>    var_value_filter <span class="op">=</span> <span class="st">"feature_name == 'MYBPC3'"</span>,</span>
+<span>    obs_column_names <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"dataset_id"</span>, <span class="st">"cell_type"</span><span class="op">)</span></span>
+<span><span class="op">)</span></span>
+<span></span>
+<span><span class="co"># Get a citation string for the slice</span></span>
+<span><span class="va">slice_datasets</span> <span class="op">=</span> <span class="va">datasets</span><span class="op">[</span><span class="va">datasets</span><span class="op">$</span><span class="va">dataset_id</span>  <span class="op"><a href="https://rdrr.io/r/base/match.html" class="external-link">%in%</a></span> <span class="va">seurat_obj</span><span class="op">[[</span><span class="op">]</span><span class="op">]</span><span class="op">$</span><span class="va">dataset_id</span>,<span class="op">]</span></span>
+<span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="va">slice_datasets</span><span class="op">$</span><span class="va">citation</span><span class="op">)</span></span>
+<span><span class="co">#&gt; [1] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [2] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [3] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [4] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [5] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [6] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span></code></pre></div>
+</div>
+<div class="section level3">
+<h3 id="via-singlecellexperiment-query">Via SingleCellExperiment query<a class="anchor" aria-label="anchor" href="#via-singlecellexperiment-query"></a>
+</h3>
+<div class="sourceCode" id="cb5"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="co"># Fetch a Seurat object</span></span>
+<span><span class="va">sce_obj</span> <span class="op">&lt;-</span> <span class="fu"><a href="../reference/get_single_cell_experiment.html">get_single_cell_experiment</a></span><span class="op">(</span></span>
+<span>    census <span class="op">=</span> <span class="va">census</span>,</span>
+<span>    organism <span class="op">=</span> <span class="st">"homo_sapiens"</span>,</span>
+<span>    measurement_name <span class="op">=</span> <span class="st">"RNA"</span>,</span>
+<span>    obs_value_filter <span class="op">=</span> <span class="st">"tissue == 'cardiac atrium'"</span>,</span>
+<span>    var_value_filter <span class="op">=</span> <span class="st">"feature_name == 'MYBPC3'"</span>,</span>
+<span>    obs_column_names <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"dataset_id"</span>, <span class="st">"cell_type"</span><span class="op">)</span></span>
+<span><span class="op">)</span></span>
+<span></span>
+<span><span class="co"># Get a citation string for the slice</span></span>
+<span><span class="va">slice_datasets</span> <span class="op">=</span> <span class="va">datasets</span><span class="op">[</span><span class="va">datasets</span><span class="op">$</span><span class="va">dataset_id</span>  <span class="op"><a href="https://rdrr.io/r/base/match.html" class="external-link">%in%</a></span> <span class="va">sce_obj</span><span class="op">$</span><span class="va">dataset_id</span>,<span class="op">]</span></span>
+<span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="va">slice_datasets</span><span class="op">$</span><span class="va">citation</span><span class="op">)</span></span>
+<span><span class="co">#&gt; [1] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [2] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [3] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [4] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [5] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span>
+<span><span class="co">#&gt; [6] "Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5"</span></span></code></pre></div>
+</div>
+</div>
+  </main><aside class="col-md-3"><nav id="toc"><h2>On this page</h2>
+    </nav></aside>
+</div>
+
+
+
+    <footer><div class="pkgdown-footer-left">
+  <p></p>
+<p>Developed by Chan Zuckerberg Initiative Foundation.</p>
+</div>
+
+<div class="pkgdown-footer-right">
+  <p></p>
+<p>Site built with <a href="https://pkgdown.r-lib.org/" class="external-link">pkgdown</a> 2.0.7.</p>
+</div>
+
+    </footer>
+</div>
+
+  
+
+  
+
+  </body>
+</html>
diff --git a/r/articles/census_compute_over_X.html b/r/articles/census_compute_over_X.html
index b27c3aae4..bb9d71c8a 100644
--- a/r/articles/census_compute_over_X.html
+++ b/r/articles/census_compute_over_X.html
@@ -61,6 +61,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -175,40 +176,40 @@ <h2 id="incremental-mean-calculation">Incremental mean calculation<a class="anch
 <span><span class="va">genes_df</span><span class="op">$</span><span class="va">raw_mean</span> <span class="op">&lt;-</span> <span class="va">raw_sum_by_gene</span> <span class="op">/</span> <span class="va">query</span><span class="op">$</span><span class="va">n_obs</span></span>
 <span><span class="va">genes_df</span></span>
 <span><span class="co">#&gt;            feature_id  feature_name     raw_mean</span></span>
-<span><span class="co">#&gt; 1  ENSMUSG00000051951          Xkr4 1.283861e+00</span></span>
-<span><span class="co">#&gt; 2  ENSMUSG00000089699        Gm1992 0.000000e+00</span></span>
-<span><span class="co">#&gt; 3  ENSMUSG00000102343       Gm37381 0.000000e+00</span></span>
-<span><span class="co">#&gt; 4  ENSMUSG00000025900           Rp1 2.914160e-01</span></span>
-<span><span class="co">#&gt; 5  ENSMUSG00000025902         Sox17 6.074154e+01</span></span>
-<span><span class="co">#&gt; 6  ENSMUSG00000104328       Gm37323 5.701742e-05</span></span>
-<span><span class="co">#&gt; 7  ENSMUSG00000033845        Mrpl15 3.621738e+01</span></span>
-<span><span class="co">#&gt; 8  ENSMUSG00000025903        Lypla1 1.827366e+01</span></span>
-<span><span class="co">#&gt; 9  ENSMUSG00000104217       Gm37988 0.000000e+00</span></span>
-<span><span class="co">#&gt; 10 ENSMUSG00000033813         Tcea1 3.960339e+01</span></span>
-<span><span class="co">#&gt; 11 ENSMUSG00000002459         Rgs20 3.212989e+00</span></span>
-<span><span class="co">#&gt; 12 ENSMUSG00000085623       Gm16041 5.701742e-05</span></span>
-<span><span class="co">#&gt; 13 ENSMUSG00000033793       Atp6v1h 6.866793e+01</span></span>
-<span><span class="co">#&gt; 14 ENSMUSG00000025905         Oprk1 4.198763e-01</span></span>
-<span><span class="co">#&gt; 15 ENSMUSG00000033774        Npbwr1 1.140348e-04</span></span>
-<span><span class="co">#&gt; 16 ENSMUSG00000025907        Rb1cc1 3.342227e+01</span></span>
-<span><span class="co">#&gt; 17 ENSMUSG00000090031 4732440D04Rik 1.317102e-02</span></span>
-<span><span class="co">#&gt; 18 ENSMUSG00000087247        Alkal1 5.701742e-05</span></span>
-<span><span class="co">#&gt; 19 ENSMUSG00000033740          St18 1.525501e+01</span></span>
-<span><span class="co">#&gt; 20 ENSMUSG00000051285        Pcmtd1 4.981224e+01</span></span>
-<span><span class="co">#&gt; 21 ENSMUSG00000097797       Gm26901 4.276306e-04</span></span>
-<span><span class="co">#&gt; 22 ENSMUSG00000103067       Gm30414 0.000000e+00</span></span>
-<span><span class="co">#&gt; 23 ENSMUSG00000025909         Sntg1 1.083131e+00</span></span>
-<span><span class="co">#&gt; 24 ENSMUSG00000061024          Rrs1 1.929504e+01</span></span>
-<span><span class="co">#&gt; 25 ENSMUSG00000025911        Adhfe1 1.163515e+01</span></span>
-<span><span class="co">#&gt; 26 ENSMUSG00000067879           Vxn 9.911623e+00</span></span>
-<span><span class="co">#&gt; 27 ENSMUSG00000099827       Gm29520 0.000000e+00</span></span>
-<span><span class="co">#&gt; 28 ENSMUSG00000025912         Mybl1 2.439775e-01</span></span>
-<span><span class="co">#&gt; 29 ENSMUSG00000045210        Vcpip1 3.177732e+01</span></span>
-<span><span class="co">#&gt; 30 ENSMUSG00000097893 1700034P13Rik 5.257291e-01</span></span>
-<span><span class="co">#&gt; 31 ENSMUSG00000025915          Sgk3 1.850455e+01</span></span>
-<span><span class="co">#&gt; 32 ENSMUSG00000046101        Mcmdc2 6.555578e-01</span></span>
-<span><span class="co">#&gt; 33 ENSMUSG00000098234         Snhg6 6.245488e+00</span></span>
-<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 52359 rows ]</span></span></code></pre></div>
+<span><span class="co">#&gt; 1  ENSMUSG00000051951          Xkr4 1.397121e+00</span></span>
+<span><span class="co">#&gt; 2  ENSMUSG00000025900           Rp1 3.162902e-01</span></span>
+<span><span class="co">#&gt; 3  ENSMUSG00000025902         Sox17 6.604085e+01</span></span>
+<span><span class="co">#&gt; 4  ENSMUSG00000033845        Mrpl15 3.939172e+01</span></span>
+<span><span class="co">#&gt; 5  ENSMUSG00000025903        Lypla1 1.986548e+01</span></span>
+<span><span class="co">#&gt; 6  ENSMUSG00000033813         Tcea1 4.305924e+01</span></span>
+<span><span class="co">#&gt; 7  ENSMUSG00000002459         Rgs20 3.496194e+00</span></span>
+<span><span class="co">#&gt; 8  ENSMUSG00000033793       Atp6v1h 7.470932e+01</span></span>
+<span><span class="co">#&gt; 9  ENSMUSG00000025905         Oprk1 4.568752e-01</span></span>
+<span><span class="co">#&gt; 10 ENSMUSG00000033774        Npbwr1 1.241003e-04</span></span>
+<span><span class="co">#&gt; 11 ENSMUSG00000025907        Rb1cc1 3.631679e+01</span></span>
+<span><span class="co">#&gt; 12 ENSMUSG00000033740          St18 1.660110e+01</span></span>
+<span><span class="co">#&gt; 13 ENSMUSG00000051285        Pcmtd1 5.410501e+01</span></span>
+<span><span class="co">#&gt; 14 ENSMUSG00000025909         Sntg1 1.178725e+00</span></span>
+<span><span class="co">#&gt; 15 ENSMUSG00000061024          Rrs1 2.098927e+01</span></span>
+<span><span class="co">#&gt; 16 ENSMUSG00000025911        Adhfe1 1.266112e+01</span></span>
+<span><span class="co">#&gt; 17 ENSMUSG00000079671 2610203C22Rik 9.474621e+00</span></span>
+<span><span class="co">#&gt; 18 ENSMUSG00000025912         Mybl1 2.643129e-01</span></span>
+<span><span class="co">#&gt; 19 ENSMUSG00000045210        Vcpip1 3.456668e+01</span></span>
+<span><span class="co">#&gt; 20 ENSMUSG00000097893 1700034P13Rik 5.721023e-01</span></span>
+<span><span class="co">#&gt; 21 ENSMUSG00000025915          Sgk3 2.012592e+01</span></span>
+<span><span class="co">#&gt; 22 ENSMUSG00000098234         Snhg6 6.784314e+00</span></span>
+<span><span class="co">#&gt; 23 ENSMUSG00000025916       Ppp1r42 2.585422e-01</span></span>
+<span><span class="co">#&gt; 24 ENSMUSG00000025917         Cops5 7.909310e+01</span></span>
+<span><span class="co">#&gt; 25 ENSMUSG00000056763         Cspp1 1.635604e+01</span></span>
+<span><span class="co">#&gt; 26 ENSMUSG00000067851       Arfgef1 1.582897e+01</span></span>
+<span><span class="co">#&gt; 27 ENSMUSG00000042501          Cpa6 1.880119e-02</span></span>
+<span><span class="co">#&gt; 28 ENSMUSG00000048960         Prex2 2.283623e+01</span></span>
+<span><span class="co">#&gt; 29 ENSMUSG00000057715 A830018L16Rik 9.992140e-01</span></span>
+<span><span class="co">#&gt; 30 ENSMUSG00000016918         Sulf1 5.567469e+00</span></span>
+<span><span class="co">#&gt; 31 ENSMUSG00000025938       Slco5a1 2.452015e-01</span></span>
+<span><span class="co">#&gt; 32 ENSMUSG00000042414        Prdm14 6.142964e-03</span></span>
+<span><span class="co">#&gt; 33 ENSMUSG00000005886         Ncoa2 1.707928e+01</span></span>
+<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 52384 rows ]</span></span></code></pre></div>
 </div>
 <div class="section level2">
 <h2 id="counting-cells-grouped-by-dataset-and-gene">Counting cells grouped by dataset and gene<a class="anchor" aria-label="anchor" href="#counting-cells-grouped-by-dataset-and-gene"></a>
@@ -270,26 +271,20 @@ <h2 id="counting-cells-grouped-by-dataset-and-gene">Counting cells grouped by da
 <span><span class="va">n_cells_grouped</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://dplyr.tidyverse.org/reference/mutate-joins.html" class="external-link">left_join</a></span><span class="op">(</span><span class="va">n_cells_grouped</span>, <span class="va">var_df</span>, by <span class="op">=</span> <span class="st">"gene_id"</span><span class="op">)</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/stopifnot.html" class="external-link">stopifnot</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/sum.html" class="external-link">sum</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/NULL.html" class="external-link">is.null</a></span><span class="op">(</span><span class="va">n_cells_grouped</span><span class="op">$</span><span class="va">feature_name</span><span class="op">)</span><span class="op">)</span> <span class="op">==</span> <span class="fl">0</span><span class="op">)</span></span>
 <span><span class="va">n_cells_grouped</span><span class="op">[</span><span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"dataset_id"</span>, <span class="st">"feature_name"</span>, <span class="st">"n_cells"</span><span class="op">)</span><span class="op">]</span></span>
-<span><span class="co">#&gt; <span style="color: #949494;"># A tibble: 17 × 3</span></span></span>
+<span><span class="co">#&gt; <span style="color: #949494;"># A tibble: 21 × 3</span></span></span>
 <span><span class="co">#&gt;    dataset_id                           feature_name n_cells</span></span>
 <span><span class="co">#&gt;    <span style="color: #949494; font-style: italic;">&lt;chr&gt;</span>                                <span style="color: #949494; font-style: italic;">&lt;chr&gt;</span>          <span style="color: #949494; font-style: italic;">&lt;dbl&gt;</span></span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 1</span> 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Dlg2           <span style="text-decoration: underline;">79</span>513</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 2</span> 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Pcdh9          <span style="text-decoration: underline;">79</span>476</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 3</span> 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Malat1         <span style="text-decoration: underline;">79</span>667</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 4</span> 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Ptprd          <span style="text-decoration: underline;">79</span>578</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 5</span> 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Dlg2              81</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 6</span> 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Pcdh9            125</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 7</span> 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Malat1         <span style="text-decoration: underline;">12</span>622</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 8</span> 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Ptprd            474</span></span>
+<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 1</span> 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Ptprd          <span style="text-decoration: underline;">79</span>578</span></span>
+<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 2</span> 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Dlg2           <span style="text-decoration: underline;">79</span>513</span></span>
+<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 3</span> 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Pcdh9          <span style="text-decoration: underline;">79</span>476</span></span>
+<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 4</span> 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Malat1         <span style="text-decoration: underline;">79</span>667</span></span>
+<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 5</span> 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Ptprd            474</span></span>
+<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 6</span> 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Dlg2              81</span></span>
+<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 7</span> 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Pcdh9            125</span></span>
+<span><span class="co">#&gt; <span style="color: #BCBCBC;"> 8</span> 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Malat1         <span style="text-decoration: underline;">12</span>622</span></span>
 <span><span class="co">#&gt; <span style="color: #BCBCBC;"> 9</span> 66ff82b4-9380-469c-bc4b-cfa08eacd325 Dlg2             856</span></span>
 <span><span class="co">#&gt; <span style="color: #BCBCBC;">10</span> 66ff82b4-9380-469c-bc4b-cfa08eacd325 Pcdh9           <span style="text-decoration: underline;">2</span>910</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;">11</span> 66ff82b4-9380-469c-bc4b-cfa08eacd325 Malat1          <span style="text-decoration: underline;">7</span>102</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;">12</span> 98e5ea9f-16d6-47ec-a529-686e76515e39 Dlg2             908</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;">13</span> 98e5ea9f-16d6-47ec-a529-686e76515e39 Pcdh9           <span style="text-decoration: underline;">3</span>027</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;">14</span> 98e5ea9f-16d6-47ec-a529-686e76515e39 Malat1         <span style="text-decoration: underline;">20</span>094</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;">15</span> c08f8441-4a10-4748-872a-e70c0bcccdba Dlg2              52</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;">16</span> c08f8441-4a10-4748-872a-e70c0bcccdba Pcdh9            117</span></span>
-<span><span class="co">#&gt; <span style="color: #BCBCBC;">17</span> c08f8441-4a10-4748-872a-e70c0bcccdba Malat1         <span style="text-decoration: underline;">12</span>992</span></span></code></pre></div>
+<span><span class="co">#&gt; <span style="color: #949494;"># ℹ 11 more rows</span></span></span></code></pre></div>
 <p>Don’t forget to close the census.</p>
 <div class="sourceCode" id="cb3"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">census</span><span class="op">$</span><span class="fu">close</span><span class="op">(</span><span class="op">)</span></span></code></pre></div>
diff --git a/r/articles/census_dataset_presence.html b/r/articles/census_dataset_presence.html
index e11b3d2f2..0104516b0 100644
--- a/r/articles/census_dataset_presence.html
+++ b/r/articles/census_dataset_presence.html
@@ -61,6 +61,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -134,71 +135,78 @@ <h2 id="fetching-the-ids-of-the-census-datasets">Fetching the IDs of the Census
 <span><span class="va">datasets_df</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_info"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"datasets"</span><span class="op">)</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span><span class="op">)</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="va">datasets_df</span><span class="op">)</span></span>
 <span><span class="co">#&gt;    soma_joinid                        collection_id</span></span>
-<span><span class="co">#&gt; 1            0 e2c257e7-6f79-487c-b81c-39451cd4ab3c</span></span>
-<span><span class="co">#&gt; 2            1 e2c257e7-6f79-487c-b81c-39451cd4ab3c</span></span>
-<span><span class="co">#&gt; 3            2 e2c257e7-6f79-487c-b81c-39451cd4ab3c</span></span>
-<span><span class="co">#&gt; 4            3 f7cecffa-00b4-4560-a29a-8ad626b8ee08</span></span>
-<span><span class="co">#&gt; 5            4 3f50314f-bdc9-40c6-8e4a-b0901ebfbe4c</span></span>
-<span><span class="co">#&gt; 6            5 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 7            6 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 8            7 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 9            8 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 10           9 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 11          10 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 12          11 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt;                                                                                                                             collection_name</span></span>
-<span><span class="co">#&gt; 1                                                                      Spatial multiomics map of trophoblast development in early pregnancy</span></span>
-<span><span class="co">#&gt; 2                                                                      Spatial multiomics map of trophoblast development in early pregnancy</span></span>
-<span><span class="co">#&gt; 3                                                                      Spatial multiomics map of trophoblast development in early pregnancy</span></span>
-<span><span class="co">#&gt; 4                                       Mapping single-cell transcriptomes in the intra-tumoral and associated territories of kidney cancer</span></span>
-<span><span class="co">#&gt; 5  Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy</span></span>
-<span><span class="co">#&gt; 6                                                                                                                            Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 7                                                                                                                            Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 8                                                                                                                            Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 9                                                                                                                            Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 10                                                                                                                           Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 11                                                                                                                           Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 12                                                                                                                           Tabula Sapiens</span></span>
-<span><span class="co">#&gt;                 collection_doi                           dataset_id</span></span>
-<span><span class="co">#&gt; 1   10.1038/s41586-023-05869-0 f171db61-e57e-4535-a06a-35d8b6ef8f2b</span></span>
-<span><span class="co">#&gt; 2   10.1038/s41586-023-05869-0 ecf2e08e-2032-4a9e-b466-b65b395f4a02</span></span>
-<span><span class="co">#&gt; 3   10.1038/s41586-023-05869-0 74cff64f-9da9-4b2a-9b3b-8a04a1598040</span></span>
-<span><span class="co">#&gt; 4  10.1016/j.ccell.2022.11.001 5af90777-6760-4003-9dba-8f945fec6fdf</span></span>
-<span><span class="co">#&gt; 5  10.1016/j.ccell.2021.03.007 bd65a70f-b274-4133-b9dd-0d1431b6af34</span></span>
-<span><span class="co">#&gt; 6      10.1126/science.abl4896 ff45e623-7f5f-46e3-b47d-56be0341f66b</span></span>
-<span><span class="co">#&gt; 7      10.1126/science.abl4896 f01bdd17-4902-40f5-86e3-240d66dd2587</span></span>
-<span><span class="co">#&gt; 8      10.1126/science.abl4896 e6a11140-2545-46bc-929e-da243eed2cae</span></span>
-<span><span class="co">#&gt; 9      10.1126/science.abl4896 e5c63d94-593c-4338-a489-e1048599e751</span></span>
-<span><span class="co">#&gt; 10     10.1126/science.abl4896 d8732da6-8d1d-42d9-b625-f2416c30054b</span></span>
-<span><span class="co">#&gt; 11     10.1126/science.abl4896 d77ec7d6-ef2e-49d6-9e79-05b7f8881484</span></span>
-<span><span class="co">#&gt; 12     10.1126/science.abl4896 cee11228-9f0b-4e57-afe2-cfe15ee56312</span></span>
-<span><span class="co">#&gt;                                                                                                                               dataset_title</span></span>
-<span><span class="co">#&gt; 1                                                                                                                    donor_p13_trophoblasts</span></span>
-<span><span class="co">#&gt; 2                                                                                                                   All donors trophoblasts</span></span>
-<span><span class="co">#&gt; 3                                                                                                      All donors all cell states (in vivo)</span></span>
-<span><span class="co">#&gt; 4                                                                      Single-cell transcriptomic datasets of Renal cell carcinoma patients</span></span>
-<span><span class="co">#&gt; 5  Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy</span></span>
-<span><span class="co">#&gt; 6                                                                                                                 Tabula Sapiens - Pancreas</span></span>
-<span><span class="co">#&gt; 7                                                                                                           Tabula Sapiens - Salivary_Gland</span></span>
-<span><span class="co">#&gt; 8                                                                                                                    Tabula Sapiens - Heart</span></span>
-<span><span class="co">#&gt; 9                                                                                                                  Tabula Sapiens - Bladder</span></span>
-<span><span class="co">#&gt; 10                                                                                                                 Tabula Sapiens - Trachea</span></span>
-<span><span class="co">#&gt; 11                                                                                                                Tabula Sapiens - Prostate</span></span>
-<span><span class="co">#&gt; 12                                                                                                                  Tabula Sapiens - Spleen</span></span>
+<span><span class="co">#&gt; 1            0 4dca242c-d302-4dba-a68f-4c61e7bad553</span></span>
+<span><span class="co">#&gt; 2            1 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f</span></span>
+<span><span class="co">#&gt; 3            2 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f</span></span>
+<span><span class="co">#&gt; 4            3 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f</span></span>
+<span><span class="co">#&gt; 5            4 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f</span></span>
+<span><span class="co">#&gt; 6            5 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f</span></span>
+<span><span class="co">#&gt; 7            6 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f</span></span>
+<span><span class="co">#&gt; 8            7 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f</span></span>
+<span><span class="co">#&gt; 9            8 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f</span></span>
+<span><span class="co">#&gt; 10           9 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f</span></span>
+<span><span class="co">#&gt; 11          10 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f</span></span>
+<span><span class="co">#&gt;                                                                       collection_name</span></span>
+<span><span class="co">#&gt; 1                Comparative transcriptomics reveals human-specific cortical features</span></span>
+<span><span class="co">#&gt; 2  Transcriptomic cytoarchitecture reveals principles of human neocortex organization</span></span>
+<span><span class="co">#&gt; 3  Transcriptomic cytoarchitecture reveals principles of human neocortex organization</span></span>
+<span><span class="co">#&gt; 4  Transcriptomic cytoarchitecture reveals principles of human neocortex organization</span></span>
+<span><span class="co">#&gt; 5  Transcriptomic cytoarchitecture reveals principles of human neocortex organization</span></span>
+<span><span class="co">#&gt; 6  Transcriptomic cytoarchitecture reveals principles of human neocortex organization</span></span>
+<span><span class="co">#&gt; 7  Transcriptomic cytoarchitecture reveals principles of human neocortex organization</span></span>
+<span><span class="co">#&gt; 8  Transcriptomic cytoarchitecture reveals principles of human neocortex organization</span></span>
+<span><span class="co">#&gt; 9  Transcriptomic cytoarchitecture reveals principles of human neocortex organization</span></span>
+<span><span class="co">#&gt; 10 Transcriptomic cytoarchitecture reveals principles of human neocortex organization</span></span>
+<span><span class="co">#&gt; 11 Transcriptomic cytoarchitecture reveals principles of human neocortex organization</span></span>
+<span><span class="co">#&gt;             collection_doi                           dataset_id</span></span>
+<span><span class="co">#&gt; 1  10.1126/science.ade9516 2bdd3a2c-2ff4-4314-adf3-8a06b797a33a</span></span>
+<span><span class="co">#&gt; 2  10.1126/science.adf6812 f5b0810c-1664-4a62-ad06-be1d9964aa8b</span></span>
+<span><span class="co">#&gt; 3  10.1126/science.adf6812 e4ddac12-f48f-4455-8e8d-c2a48a683437</span></span>
+<span><span class="co">#&gt; 4  10.1126/science.adf6812 e2808a6e-e2ea-41b9-b38c-4a08f1677f02</span></span>
+<span><span class="co">#&gt; 5  10.1126/science.adf6812 d01c9dff-abd1-4825-bf30-2eb2ba74597e</span></span>
+<span><span class="co">#&gt; 6  10.1126/science.adf6812 c3aa4f95-7a18-4a7d-8dd8-ca324d714363</span></span>
+<span><span class="co">#&gt; 7  10.1126/science.adf6812 be401db3-d732-408a-b0c4-71af0458b8ab</span></span>
+<span><span class="co">#&gt; 8  10.1126/science.adf6812 a5d5c529-8a1f-40b5-bda3-35208970070d</span></span>
+<span><span class="co">#&gt; 9  10.1126/science.adf6812 9c63201d-bfd9-41a8-bbbc-18d947556f3d</span></span>
+<span><span class="co">#&gt; 10 10.1126/science.adf6812 93cb76aa-a84b-4a92-8e6c-66a914e26d4c</span></span>
+<span><span class="co">#&gt; 11 10.1126/science.adf6812 8d1dd010-5cbc-43fb-83f8-e0de8e8517da</span></span>
+<span><span class="co">#&gt;                      dataset_version_id</span></span>
+<span><span class="co">#&gt; 1  7eb7f2fd-fd74-4c99-863c-97836415652e</span></span>
+<span><span class="co">#&gt; 2  d4427196-7876-4bdd-a929-ae4d177ec776</span></span>
+<span><span class="co">#&gt; 3  3280113b-7148-4a3e-98d4-015f443aab8a</span></span>
+<span><span class="co">#&gt; 4  dc092185-3b8e-4fcb-ae21-1dc106d683ac</span></span>
+<span><span class="co">#&gt; 5  c4959ded-83dc-4442-aac7-9a59bdb47801</span></span>
+<span><span class="co">#&gt; 6  0476ef54-aefe-4754-b0e9-d9fcd75adff4</span></span>
+<span><span class="co">#&gt; 7  ee027704-72aa-4195-a467-0754db1ed65d</span></span>
+<span><span class="co">#&gt; 8  d47c0742-cea2-46c1-9e72-4d479214041c</span></span>
+<span><span class="co">#&gt; 9  8b09695a-1426-4867-961e-c40a1fbcc2da</span></span>
+<span><span class="co">#&gt; 10 98ad7381-f464-4f49-b850-5321b4f98be6</span></span>
+<span><span class="co">#&gt; 11 c56683d2-452a-45dc-b402-35397e27e325</span></span>
+<span><span class="co">#&gt;                                           dataset_title</span></span>
+<span><span class="co">#&gt; 1                               Human: Great apes study</span></span>
+<span><span class="co">#&gt; 2                       Dissection: Angular gyrus (AnG)</span></span>
+<span><span class="co">#&gt; 3                Supercluster: CGE-derived interneurons</span></span>
+<span><span class="co">#&gt; 4               Dissection: Primary auditory cortex(A1)</span></span>
+<span><span class="co">#&gt; 5  Supercluster: Deep layer (non-IT) excitatory neurons</span></span>
+<span><span class="co">#&gt; 6        Supercluster: IT-projecting excitatory neurons</span></span>
+<span><span class="co">#&gt; 7           Dissection: Anterior cingulate cortex (ACC)</span></span>
+<span><span class="co">#&gt; 8               Human Multiple Cortical Areas SMART-seq</span></span>
+<span><span class="co">#&gt; 9                Supercluster: MGE-derived interneurons</span></span>
+<span><span class="co">#&gt; 10        Dissection: Primary somatosensory cortex (S1)</span></span>
+<span><span class="co">#&gt; 11                Dissection: Primary visual cortex(V1)</span></span>
 <span><span class="co">#&gt;                            dataset_h5ad_path dataset_total_cell_count</span></span>
-<span><span class="co">#&gt; 1  f171db61-e57e-4535-a06a-35d8b6ef8f2b.h5ad                    31497</span></span>
-<span><span class="co">#&gt; 2  ecf2e08e-2032-4a9e-b466-b65b395f4a02.h5ad                    67070</span></span>
-<span><span class="co">#&gt; 3  74cff64f-9da9-4b2a-9b3b-8a04a1598040.h5ad                   286326</span></span>
-<span><span class="co">#&gt; 4  5af90777-6760-4003-9dba-8f945fec6fdf.h5ad                   270855</span></span>
-<span><span class="co">#&gt; 5  bd65a70f-b274-4133-b9dd-0d1431b6af34.h5ad                   167283</span></span>
-<span><span class="co">#&gt; 6  ff45e623-7f5f-46e3-b47d-56be0341f66b.h5ad                    13497</span></span>
-<span><span class="co">#&gt; 7  f01bdd17-4902-40f5-86e3-240d66dd2587.h5ad                    27199</span></span>
-<span><span class="co">#&gt; 8  e6a11140-2545-46bc-929e-da243eed2cae.h5ad                    11505</span></span>
-<span><span class="co">#&gt; 9  e5c63d94-593c-4338-a489-e1048599e751.h5ad                    24583</span></span>
-<span><span class="co">#&gt; 10 d8732da6-8d1d-42d9-b625-f2416c30054b.h5ad                     9522</span></span>
-<span><span class="co">#&gt; 11 d77ec7d6-ef2e-49d6-9e79-05b7f8881484.h5ad                    16375</span></span>
-<span><span class="co">#&gt; 12 cee11228-9f0b-4e57-afe2-cfe15ee56312.h5ad                    34004</span></span>
-<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 581 rows ]</span></span></code></pre></div>
+<span><span class="co">#&gt; 1  2bdd3a2c-2ff4-4314-adf3-8a06b797a33a.h5ad                   156285</span></span>
+<span><span class="co">#&gt; 2  f5b0810c-1664-4a62-ad06-be1d9964aa8b.h5ad                   110752</span></span>
+<span><span class="co">#&gt; 3  e4ddac12-f48f-4455-8e8d-c2a48a683437.h5ad                   129495</span></span>
+<span><span class="co">#&gt; 4  e2808a6e-e2ea-41b9-b38c-4a08f1677f02.h5ad                   139054</span></span>
+<span><span class="co">#&gt; 5  d01c9dff-abd1-4825-bf30-2eb2ba74597e.h5ad                    92969</span></span>
+<span><span class="co">#&gt; 6  c3aa4f95-7a18-4a7d-8dd8-ca324d714363.h5ad                   638941</span></span>
+<span><span class="co">#&gt; 7  be401db3-d732-408a-b0c4-71af0458b8ab.h5ad                   135462</span></span>
+<span><span class="co">#&gt; 8  a5d5c529-8a1f-40b5-bda3-35208970070d.h5ad                    49417</span></span>
+<span><span class="co">#&gt; 9  9c63201d-bfd9-41a8-bbbc-18d947556f3d.h5ad                   185477</span></span>
+<span><span class="co">#&gt; 10 93cb76aa-a84b-4a92-8e6c-66a914e26d4c.h5ad                   153159</span></span>
+<span><span class="co">#&gt; 11 8d1dd010-5cbc-43fb-83f8-e0de8e8517da.h5ad                   241077</span></span>
+<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 640 rows ]</span></span></code></pre></div>
 </div>
 <div class="section level2">
 <h2 id="fetching-the-dataset-presence-matrix">Fetching the dataset presence matrix<a class="anchor" aria-label="anchor" href="#fetching-the-dataset-presence-matrix"></a>
@@ -213,33 +221,24 @@ <h2 id="fetching-the-dataset-presence-matrix">Fetching the dataset presence matr
 <div class="sourceCode" id="cb4"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">var_df</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">human_rna</span><span class="op">$</span><span class="va">var</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span><span class="op">)</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="va">var_df</span><span class="op">)</span></span>
-<span><span class="co">#&gt;    soma_joinid      feature_id feature_name feature_length</span></span>
-<span><span class="co">#&gt; 1            0 ENSG00000121410         A1BG           3999</span></span>
-<span><span class="co">#&gt; 2            1 ENSG00000268895     A1BG-AS1           3374</span></span>
-<span><span class="co">#&gt; 3            2 ENSG00000148584         A1CF           9603</span></span>
-<span><span class="co">#&gt; 4            3 ENSG00000175899          A2M           6318</span></span>
-<span><span class="co">#&gt; 5            4 ENSG00000245105      A2M-AS1           2948</span></span>
-<span><span class="co">#&gt; 6            5 ENSG00000166535        A2ML1           7156</span></span>
-<span><span class="co">#&gt; 7            6 ENSG00000256661    A2ML1-AS1            452</span></span>
-<span><span class="co">#&gt; 8            7 ENSG00000184389      A3GALT2           1023</span></span>
-<span><span class="co">#&gt; 9            8 ENSG00000128274       A4GALT           3358</span></span>
-<span><span class="co">#&gt; 10           9 ENSG00000118017        A4GNT           1779</span></span>
-<span><span class="co">#&gt; 11          10 ENSG00000094914         AAAS           4727</span></span>
-<span><span class="co">#&gt; 12          11 ENSG00000081760         AACS          16039</span></span>
-<span><span class="co">#&gt; 13          12 ENSG00000114771        AADAC           1632</span></span>
-<span><span class="co">#&gt; 14          13 ENSG00000197953      AADACL2           5071</span></span>
-<span><span class="co">#&gt; 15          14 ENSG00000242908  AADACL2-AS1            635</span></span>
-<span><span class="co">#&gt; 16          15 ENSG00000188984      AADACL3           4055</span></span>
-<span><span class="co">#&gt; 17          16 ENSG00000204518      AADACL4           2027</span></span>
-<span><span class="co">#&gt; 18          17 ENSG00000109576        AADAT           2970</span></span>
-<span><span class="co">#&gt; 19          18 ENSG00000158122       PRXL2C           3098</span></span>
-<span><span class="co">#&gt; 20          19 ENSG00000103591        AAGAB           4138</span></span>
-<span><span class="co">#&gt; 21          20 ENSG00000115977         AAK1          24843</span></span>
-<span><span class="co">#&gt; 22          21 ENSG00000087884        AAMDC           1943</span></span>
-<span><span class="co">#&gt; 23          22 ENSG00000127837         AAMP           3055</span></span>
-<span><span class="co">#&gt; 24          23 ENSG00000129673        AANAT           2156</span></span>
-<span><span class="co">#&gt; 25          24 ENSG00000131043         AAR2           7291</span></span>
-<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 60639 rows ]</span></span></code></pre></div>
+<span><span class="co">#&gt;    soma_joinid      feature_id feature_name feature_length      nnz n_measured_obs</span></span>
+<span><span class="co">#&gt; 1            0 ENSG00000233576      HTR3C2P           1057    69370       19581263</span></span>
+<span><span class="co">#&gt; 2            1 ENSG00000121410         A1BG           3999  5640476       62641311</span></span>
+<span><span class="co">#&gt; 3            2 ENSG00000268895     A1BG-AS1           3374  3071864       61946057</span></span>
+<span><span class="co">#&gt; 4            3 ENSG00000148584         A1CF           9603   734347       58195911</span></span>
+<span><span class="co">#&gt; 5            4 ENSG00000175899          A2M           6318  7894261       62704378</span></span>
+<span><span class="co">#&gt; 6            5 ENSG00000245105      A2M-AS1           2948  1637794       62086816</span></span>
+<span><span class="co">#&gt; 7            6 ENSG00000166535        A2ML1           7156  2156616       60911688</span></span>
+<span><span class="co">#&gt; 8            7 ENSG00000256069        A2MP1           4657   835384       23554778</span></span>
+<span><span class="co">#&gt; 9            8 ENSG00000184389      A3GALT2           1023   439067       53780311</span></span>
+<span><span class="co">#&gt; 10           9 ENSG00000128274       A4GALT           3358  2432348       62706770</span></span>
+<span><span class="co">#&gt; 11          10 ENSG00000118017        A4GNT           1779    52430       56117399</span></span>
+<span><span class="co">#&gt; 12          11 ENSG00000265544         AA06            632   220755       22545140</span></span>
+<span><span class="co">#&gt; 13          12 ENSG00000081760         AACS          16039 11280800       62842909</span></span>
+<span><span class="co">#&gt; 14          13 ENSG00000250420       AACSP1           3380   211588       22831831</span></span>
+<span><span class="co">#&gt; 15          14 ENSG00000114771        AADAC           1632   552258       54941618</span></span>
+<span><span class="co">#&gt; 16          15 ENSG00000188984      AADACL3           4055    24626       43074608</span></span>
+<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 60648 rows ]</span></span></code></pre></div>
 </div>
 <div class="section level2">
 <h2 id="identifying-genes-measured-in-a-specific-dataset">Identifying genes measured in a specific dataset<a class="anchor" aria-label="anchor" href="#identifying-genes-measured-in-a-specific-dataset"></a>
@@ -285,71 +284,78 @@ <h2 id="identifying-datasets-that-measured-specific-genes">Identifying datasets
 <span><span class="co"># From the datasets dataframe, slice out the datasets which have a joinid in the list</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="va">datasets_df</span><span class="op">[</span><span class="va">dataset_joinids</span>, <span class="op">]</span><span class="op">)</span></span>
 <span><span class="co">#&gt;    soma_joinid                        collection_id</span></span>
-<span><span class="co">#&gt; 5            4 3f50314f-bdc9-40c6-8e4a-b0901ebfbe4c</span></span>
-<span><span class="co">#&gt; 6            5 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 7            6 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 8            7 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 9            8 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 11          10 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 12          11 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 14          13 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 15          14 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 19          18 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 20          19 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
-<span><span class="co">#&gt; 21          20 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
+<span><span class="co">#&gt; 63          62 3f50314f-bdc9-40c6-8e4a-b0901ebfbe4c</span></span>
+<span><span class="co">#&gt; 64          63 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
+<span><span class="co">#&gt; 65          64 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
+<span><span class="co">#&gt; 66          65 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
+<span><span class="co">#&gt; 67          66 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
+<span><span class="co">#&gt; 69          68 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
+<span><span class="co">#&gt; 70          69 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
+<span><span class="co">#&gt; 72          71 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
+<span><span class="co">#&gt; 73          72 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
+<span><span class="co">#&gt; 77          76 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
+<span><span class="co">#&gt; 78          77 e5f58829-1a66-40b5-a624-9046778e74f5</span></span>
 <span><span class="co">#&gt;                                                                                                                             collection_name</span></span>
-<span><span class="co">#&gt; 5  Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy</span></span>
-<span><span class="co">#&gt; 6                                                                                                                            Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 7                                                                                                                            Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 8                                                                                                                            Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 9                                                                                                                            Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 11                                                                                                                           Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 12                                                                                                                           Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 14                                                                                                                           Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 15                                                                                                                           Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 19                                                                                                                           Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 20                                                                                                                           Tabula Sapiens</span></span>
-<span><span class="co">#&gt; 21                                                                                                                           Tabula Sapiens</span></span>
+<span><span class="co">#&gt; 63 Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy</span></span>
+<span><span class="co">#&gt; 64                                                                                                                           Tabula Sapiens</span></span>
+<span><span class="co">#&gt; 65                                                                                                                           Tabula Sapiens</span></span>
+<span><span class="co">#&gt; 66                                                                                                                           Tabula Sapiens</span></span>
+<span><span class="co">#&gt; 67                                                                                                                           Tabula Sapiens</span></span>
+<span><span class="co">#&gt; 69                                                                                                                           Tabula Sapiens</span></span>
+<span><span class="co">#&gt; 70                                                                                                                           Tabula Sapiens</span></span>
+<span><span class="co">#&gt; 72                                                                                                                           Tabula Sapiens</span></span>
+<span><span class="co">#&gt; 73                                                                                                                           Tabula Sapiens</span></span>
+<span><span class="co">#&gt; 77                                                                                                                           Tabula Sapiens</span></span>
+<span><span class="co">#&gt; 78                                                                                                                           Tabula Sapiens</span></span>
 <span><span class="co">#&gt;                 collection_doi                           dataset_id</span></span>
-<span><span class="co">#&gt; 5  10.1016/j.ccell.2021.03.007 bd65a70f-b274-4133-b9dd-0d1431b6af34</span></span>
-<span><span class="co">#&gt; 6      10.1126/science.abl4896 ff45e623-7f5f-46e3-b47d-56be0341f66b</span></span>
-<span><span class="co">#&gt; 7      10.1126/science.abl4896 f01bdd17-4902-40f5-86e3-240d66dd2587</span></span>
-<span><span class="co">#&gt; 8      10.1126/science.abl4896 e6a11140-2545-46bc-929e-da243eed2cae</span></span>
-<span><span class="co">#&gt; 9      10.1126/science.abl4896 e5c63d94-593c-4338-a489-e1048599e751</span></span>
-<span><span class="co">#&gt; 11     10.1126/science.abl4896 d77ec7d6-ef2e-49d6-9e79-05b7f8881484</span></span>
-<span><span class="co">#&gt; 12     10.1126/science.abl4896 cee11228-9f0b-4e57-afe2-cfe15ee56312</span></span>
-<span><span class="co">#&gt; 14     10.1126/science.abl4896 a2d4d33e-4c62-4361-b80a-9be53d2e50e8</span></span>
-<span><span class="co">#&gt; 15     10.1126/science.abl4896 a0754256-f44b-4c4a-962c-a552e47d3fdc</span></span>
-<span><span class="co">#&gt; 19     10.1126/science.abl4896 6d41668c-168c-4500-b06a-4674ccf3e19d</span></span>
-<span><span class="co">#&gt; 20     10.1126/science.abl4896 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c</span></span>
-<span><span class="co">#&gt; 21     10.1126/science.abl4896 55cf0ea3-9d2b-4294-871e-bb4b49a79fc7</span></span>
+<span><span class="co">#&gt; 63 10.1016/j.ccell.2021.03.007 bd65a70f-b274-4133-b9dd-0d1431b6af34</span></span>
+<span><span class="co">#&gt; 64     10.1126/science.abl4896 ff45e623-7f5f-46e3-b47d-56be0341f66b</span></span>
+<span><span class="co">#&gt; 65     10.1126/science.abl4896 f01bdd17-4902-40f5-86e3-240d66dd2587</span></span>
+<span><span class="co">#&gt; 66     10.1126/science.abl4896 e6a11140-2545-46bc-929e-da243eed2cae</span></span>
+<span><span class="co">#&gt; 67     10.1126/science.abl4896 e5c63d94-593c-4338-a489-e1048599e751</span></span>
+<span><span class="co">#&gt; 69     10.1126/science.abl4896 d77ec7d6-ef2e-49d6-9e79-05b7f8881484</span></span>
+<span><span class="co">#&gt; 70     10.1126/science.abl4896 cee11228-9f0b-4e57-afe2-cfe15ee56312</span></span>
+<span><span class="co">#&gt; 72     10.1126/science.abl4896 a2d4d33e-4c62-4361-b80a-9be53d2e50e8</span></span>
+<span><span class="co">#&gt; 73     10.1126/science.abl4896 a0754256-f44b-4c4a-962c-a552e47d3fdc</span></span>
+<span><span class="co">#&gt; 77     10.1126/science.abl4896 6d41668c-168c-4500-b06a-4674ccf3e19d</span></span>
+<span><span class="co">#&gt; 78     10.1126/science.abl4896 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c</span></span>
+<span><span class="co">#&gt;                      dataset_version_id</span></span>
+<span><span class="co">#&gt; 63 71815674-a8cf-4add-95dd-c5d5d1631597</span></span>
+<span><span class="co">#&gt; 64 0b29f4ce-5e72-4356-b74b-b54714979234</span></span>
+<span><span class="co">#&gt; 65 bd13c169-af97-4d8f-ba45-7588808c2e48</span></span>
+<span><span class="co">#&gt; 66 47615a3d-0a9f-4a78-88ef-5cce2a84637d</span></span>
+<span><span class="co">#&gt; 67 ac7714f0-dce2-40ba-9912-324de6c9a77f</span></span>
+<span><span class="co">#&gt; 69 c7679ec2-652d-437a-bded-3ec2344829e4</span></span>
+<span><span class="co">#&gt; 70 f89fa18f-c32b-4bae-9511-1a4d18f200e1</span></span>
+<span><span class="co">#&gt; 72 37ada0d2-9970-4ff2-8bcd-41e80ab6e081</span></span>
+<span><span class="co">#&gt; 73 1cda78aa-f0d9-4d50-96bf-8bc309318802</span></span>
+<span><span class="co">#&gt; 77 5297a910-453f-4e3f-af16-e18fd5a79090</span></span>
+<span><span class="co">#&gt; 78 b783b036-c837-4290-a07d-f6b79a301f59</span></span>
 <span><span class="co">#&gt;                                                                                                                               dataset_title</span></span>
-<span><span class="co">#&gt; 5  Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy</span></span>
-<span><span class="co">#&gt; 6                                                                                                                 Tabula Sapiens - Pancreas</span></span>
-<span><span class="co">#&gt; 7                                                                                                           Tabula Sapiens - Salivary_Gland</span></span>
-<span><span class="co">#&gt; 8                                                                                                                    Tabula Sapiens - Heart</span></span>
-<span><span class="co">#&gt; 9                                                                                                                  Tabula Sapiens - Bladder</span></span>
-<span><span class="co">#&gt; 11                                                                                                                Tabula Sapiens - Prostate</span></span>
-<span><span class="co">#&gt; 12                                                                                                                  Tabula Sapiens - Spleen</span></span>
-<span><span class="co">#&gt; 14                                                                                                             Tabula Sapiens - Vasculature</span></span>
-<span><span class="co">#&gt; 15                                                                                                                     Tabula Sapiens - Eye</span></span>
-<span><span class="co">#&gt; 19                                                                                                                   Tabula Sapiens - Liver</span></span>
-<span><span class="co">#&gt; 20                                                                                                                     Tabula Sapiens - Fat</span></span>
-<span><span class="co">#&gt; 21                                                                                                                  Tabula Sapiens - Tongue</span></span>
+<span><span class="co">#&gt; 63 Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy</span></span>
+<span><span class="co">#&gt; 64                                                                                                                Tabula Sapiens - Pancreas</span></span>
+<span><span class="co">#&gt; 65                                                                                                          Tabula Sapiens - Salivary_Gland</span></span>
+<span><span class="co">#&gt; 66                                                                                                                   Tabula Sapiens - Heart</span></span>
+<span><span class="co">#&gt; 67                                                                                                                 Tabula Sapiens - Bladder</span></span>
+<span><span class="co">#&gt; 69                                                                                                                Tabula Sapiens - Prostate</span></span>
+<span><span class="co">#&gt; 70                                                                                                                  Tabula Sapiens - Spleen</span></span>
+<span><span class="co">#&gt; 72                                                                                                             Tabula Sapiens - Vasculature</span></span>
+<span><span class="co">#&gt; 73                                                                                                                     Tabula Sapiens - Eye</span></span>
+<span><span class="co">#&gt; 77                                                                                                                   Tabula Sapiens - Liver</span></span>
+<span><span class="co">#&gt; 78                                                                                                                     Tabula Sapiens - Fat</span></span>
 <span><span class="co">#&gt;                            dataset_h5ad_path dataset_total_cell_count</span></span>
-<span><span class="co">#&gt; 5  bd65a70f-b274-4133-b9dd-0d1431b6af34.h5ad                   167283</span></span>
-<span><span class="co">#&gt; 6  ff45e623-7f5f-46e3-b47d-56be0341f66b.h5ad                    13497</span></span>
-<span><span class="co">#&gt; 7  f01bdd17-4902-40f5-86e3-240d66dd2587.h5ad                    27199</span></span>
-<span><span class="co">#&gt; 8  e6a11140-2545-46bc-929e-da243eed2cae.h5ad                    11505</span></span>
-<span><span class="co">#&gt; 9  e5c63d94-593c-4338-a489-e1048599e751.h5ad                    24583</span></span>
-<span><span class="co">#&gt; 11 d77ec7d6-ef2e-49d6-9e79-05b7f8881484.h5ad                    16375</span></span>
-<span><span class="co">#&gt; 12 cee11228-9f0b-4e57-afe2-cfe15ee56312.h5ad                    34004</span></span>
-<span><span class="co">#&gt; 14 a2d4d33e-4c62-4361-b80a-9be53d2e50e8.h5ad                    16037</span></span>
-<span><span class="co">#&gt; 15 a0754256-f44b-4c4a-962c-a552e47d3fdc.h5ad                    10650</span></span>
-<span><span class="co">#&gt; 19 6d41668c-168c-4500-b06a-4674ccf3e19d.h5ad                     5007</span></span>
-<span><span class="co">#&gt; 20 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c.h5ad                    20263</span></span>
-<span><span class="co">#&gt; 21 55cf0ea3-9d2b-4294-871e-bb4b49a79fc7.h5ad                    15020</span></span>
-<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 30 rows ]</span></span></code></pre></div>
+<span><span class="co">#&gt; 63 bd65a70f-b274-4133-b9dd-0d1431b6af34.h5ad                   167283</span></span>
+<span><span class="co">#&gt; 64 ff45e623-7f5f-46e3-b47d-56be0341f66b.h5ad                    13497</span></span>
+<span><span class="co">#&gt; 65 f01bdd17-4902-40f5-86e3-240d66dd2587.h5ad                    27199</span></span>
+<span><span class="co">#&gt; 66 e6a11140-2545-46bc-929e-da243eed2cae.h5ad                    11505</span></span>
+<span><span class="co">#&gt; 67 e5c63d94-593c-4338-a489-e1048599e751.h5ad                    24583</span></span>
+<span><span class="co">#&gt; 69 d77ec7d6-ef2e-49d6-9e79-05b7f8881484.h5ad                    16375</span></span>
+<span><span class="co">#&gt; 70 cee11228-9f0b-4e57-afe2-cfe15ee56312.h5ad                    34004</span></span>
+<span><span class="co">#&gt; 72 a2d4d33e-4c62-4361-b80a-9be53d2e50e8.h5ad                    16037</span></span>
+<span><span class="co">#&gt; 73 a0754256-f44b-4c4a-962c-a552e47d3fdc.h5ad                    10650</span></span>
+<span><span class="co">#&gt; 77 6d41668c-168c-4500-b06a-4674ccf3e19d.h5ad                     5007</span></span>
+<span><span class="co">#&gt; 78 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c.h5ad                    20263</span></span>
+<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 31 rows ]</span></span></code></pre></div>
 </div>
 <div class="section level2">
 <h2 id="identifying-all-genes-measured-in-a-dataset">Identifying all genes measured in a dataset<a class="anchor" aria-label="anchor" href="#identifying-all-genes-measured-in-a-dataset"></a>
@@ -365,33 +371,24 @@ <h2 id="identifying-all-genes-measured-in-a-dataset">Identifying all genes measu
 <span><span class="va">var_joinids</span> <span class="op">&lt;-</span> <span class="va">var_df</span><span class="op">$</span><span class="va">soma_joinid</span><span class="op">[</span><span class="va">genes_measured</span><span class="op">]</span></span>
 <span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="va">var_df</span><span class="op">[</span><span class="va">var_joinids</span>, <span class="op">]</span><span class="op">)</span></span>
-<span><span class="co">#&gt;    soma_joinid      feature_id feature_name feature_length</span></span>
-<span><span class="co">#&gt; 1            0 ENSG00000121410         A1BG           3999</span></span>
-<span><span class="co">#&gt; 2            1 ENSG00000268895     A1BG-AS1           3374</span></span>
-<span><span class="co">#&gt; 3            2 ENSG00000148584         A1CF           9603</span></span>
-<span><span class="co">#&gt; 4            3 ENSG00000175899          A2M           6318</span></span>
-<span><span class="co">#&gt; 5            4 ENSG00000245105      A2M-AS1           2948</span></span>
-<span><span class="co">#&gt; 6            5 ENSG00000166535        A2ML1           7156</span></span>
-<span><span class="co">#&gt; 8            7 ENSG00000184389      A3GALT2           1023</span></span>
-<span><span class="co">#&gt; 9            8 ENSG00000128274       A4GALT           3358</span></span>
-<span><span class="co">#&gt; 10           9 ENSG00000118017        A4GNT           1779</span></span>
-<span><span class="co">#&gt; 11          10 ENSG00000094914         AAAS           4727</span></span>
-<span><span class="co">#&gt; 12          11 ENSG00000081760         AACS          16039</span></span>
-<span><span class="co">#&gt; 13          12 ENSG00000114771        AADAC           1632</span></span>
-<span><span class="co">#&gt; 14          13 ENSG00000197953      AADACL2           5071</span></span>
-<span><span class="co">#&gt; 16          15 ENSG00000188984      AADACL3           4055</span></span>
-<span><span class="co">#&gt; 17          16 ENSG00000204518      AADACL4           2027</span></span>
-<span><span class="co">#&gt; 18          17 ENSG00000109576        AADAT           2970</span></span>
-<span><span class="co">#&gt; 19          18 ENSG00000158122       PRXL2C           3098</span></span>
-<span><span class="co">#&gt; 20          19 ENSG00000103591        AAGAB           4138</span></span>
-<span><span class="co">#&gt; 21          20 ENSG00000115977         AAK1          24843</span></span>
-<span><span class="co">#&gt; 22          21 ENSG00000087884        AAMDC           1943</span></span>
-<span><span class="co">#&gt; 23          22 ENSG00000127837         AAMP           3055</span></span>
-<span><span class="co">#&gt; 24          23 ENSG00000129673        AANAT           2156</span></span>
-<span><span class="co">#&gt; 25          24 ENSG00000131043         AAR2           7291</span></span>
-<span><span class="co">#&gt; 26          25 ENSG00000205002         AARD           2404</span></span>
-<span><span class="co">#&gt; 27          26 ENSG00000090861        AARS1          10248</span></span>
-<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 27185 rows ]</span></span></code></pre></div>
+<span><span class="co">#&gt;    soma_joinid      feature_id feature_name feature_length      nnz n_measured_obs</span></span>
+<span><span class="co">#&gt; 1            0 ENSG00000233576      HTR3C2P           1057    69370       19581263</span></span>
+<span><span class="co">#&gt; 2            1 ENSG00000121410         A1BG           3999  5640476       62641311</span></span>
+<span><span class="co">#&gt; 3            2 ENSG00000268895     A1BG-AS1           3374  3071864       61946057</span></span>
+<span><span class="co">#&gt; 4            3 ENSG00000148584         A1CF           9603   734347       58195911</span></span>
+<span><span class="co">#&gt; 5            4 ENSG00000175899          A2M           6318  7894261       62704378</span></span>
+<span><span class="co">#&gt; 6            5 ENSG00000245105      A2M-AS1           2948  1637794       62086816</span></span>
+<span><span class="co">#&gt; 9            8 ENSG00000184389      A3GALT2           1023   439067       53780311</span></span>
+<span><span class="co">#&gt; 10           9 ENSG00000128274       A4GALT           3358  2432348       62706770</span></span>
+<span><span class="co">#&gt; 12          11 ENSG00000265544         AA06            632   220755       22545140</span></span>
+<span><span class="co">#&gt; 14          13 ENSG00000250420       AACSP1           3380   211588       22831831</span></span>
+<span><span class="co">#&gt; 16          15 ENSG00000188984      AADACL3           4055    24626       43074608</span></span>
+<span><span class="co">#&gt; 18          17 ENSG00000240602      AADACP1           2012    29491       23133490</span></span>
+<span><span class="co">#&gt; 19          18 ENSG00000109576        AADAT           2970  4524608       61559099</span></span>
+<span><span class="co">#&gt; 20          19 ENSG00000158122       PRXL2C           3098  5424472       55618144</span></span>
+<span><span class="co">#&gt; 21          20 ENSG00000103591        AAGAB           4138 12427442       62843055</span></span>
+<span><span class="co">#&gt; 22          21 ENSG00000115977         AAK1          24843 29280566       62664775</span></span>
+<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 27195 rows ]</span></span></code></pre></div>
 <div class="section level3">
 <h3 id="close-the-census">Close the census<a class="anchor" aria-label="anchor" href="#close-the-census"></a>
 </h3>
diff --git a/r/articles/census_datasets.html b/r/articles/census_datasets.html
index 0fbaae720..d6fc36965 100644
--- a/r/articles/census_datasets.html
+++ b/r/articles/census_datasets.html
@@ -61,6 +61,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -118,12 +119,13 @@ <h2 id="fetching-the-datasets-table">Fetching the datasets table<a class="anchor
 <span><span class="va">census_datasets</span> <span class="op">&lt;-</span> <span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_info"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"datasets"</span><span class="op">)</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span><span class="op">)</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="va">census_datasets</span><span class="op">)</span></span>
 <span><span class="co">#&gt; Table</span></span>
-<span><span class="co">#&gt; 593 rows x 8 columns</span></span>
+<span><span class="co">#&gt; 651 rows x 9 columns</span></span>
 <span><span class="co">#&gt; $soma_joinid &lt;int64 not null&gt;</span></span>
 <span><span class="co">#&gt; $collection_id &lt;large_string not null&gt;</span></span>
 <span><span class="co">#&gt; $collection_name &lt;large_string not null&gt;</span></span>
 <span><span class="co">#&gt; $collection_doi &lt;large_string not null&gt;</span></span>
 <span><span class="co">#&gt; $dataset_id &lt;large_string not null&gt;</span></span>
+<span><span class="co">#&gt; $dataset_version_id &lt;large_string not null&gt;</span></span>
 <span><span class="co">#&gt; $dataset_title &lt;large_string not null&gt;</span></span>
 <span><span class="co">#&gt; $dataset_h5ad_path &lt;large_string not null&gt;</span></span>
 <span><span class="co">#&gt; $dataset_total_cell_count &lt;int64 not null&gt;</span></span></code></pre></div>
@@ -136,264 +138,264 @@ <h2 id="fetching-the-datasets-table">Fetching the datasets table<a class="anchor
 <span>  <span class="st">"dataset_total_cell_count"</span></span>
 <span><span class="op">)</span><span class="op">]</span><span class="op">)</span></span>
 <span><span class="co">#&gt;                              dataset_id</span></span>
-<span><span class="co">#&gt; 1  f171db61-e57e-4535-a06a-35d8b6ef8f2b</span></span>
-<span><span class="co">#&gt; 2  ecf2e08e-2032-4a9e-b466-b65b395f4a02</span></span>
-<span><span class="co">#&gt; 3  74cff64f-9da9-4b2a-9b3b-8a04a1598040</span></span>
-<span><span class="co">#&gt; 4  5af90777-6760-4003-9dba-8f945fec6fdf</span></span>
-<span><span class="co">#&gt; 5  bd65a70f-b274-4133-b9dd-0d1431b6af34</span></span>
-<span><span class="co">#&gt; 6  ff45e623-7f5f-46e3-b47d-56be0341f66b</span></span>
-<span><span class="co">#&gt; 7  f01bdd17-4902-40f5-86e3-240d66dd2587</span></span>
-<span><span class="co">#&gt; 8  e6a11140-2545-46bc-929e-da243eed2cae</span></span>
-<span><span class="co">#&gt; 9  e5c63d94-593c-4338-a489-e1048599e751</span></span>
-<span><span class="co">#&gt; 10 d8732da6-8d1d-42d9-b625-f2416c30054b</span></span>
-<span><span class="co">#&gt; 11 d77ec7d6-ef2e-49d6-9e79-05b7f8881484</span></span>
-<span><span class="co">#&gt; 12 cee11228-9f0b-4e57-afe2-cfe15ee56312</span></span>
-<span><span class="co">#&gt; 13 a357414d-2042-4eb5-95f0-c58604a18bdd</span></span>
-<span><span class="co">#&gt; 14 a2d4d33e-4c62-4361-b80a-9be53d2e50e8</span></span>
-<span><span class="co">#&gt; 15 a0754256-f44b-4c4a-962c-a552e47d3fdc</span></span>
-<span><span class="co">#&gt; 16 983d5ec9-40e8-4512-9e65-a572a9c486cb</span></span>
-<span><span class="co">#&gt; 17 7357cee7-9f7f-4ab0-8cec-90de8f047e38</span></span>
-<span><span class="co">#&gt; 18 6ec405bb-4727-4c6d-ab4e-01fe489af7ea</span></span>
-<span><span class="co">#&gt; 19 6d41668c-168c-4500-b06a-4674ccf3e19d</span></span>
-<span><span class="co">#&gt; 20 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c</span></span>
-<span><span class="co">#&gt; 21 55cf0ea3-9d2b-4294-871e-bb4b49a79fc7</span></span>
-<span><span class="co">#&gt; 22 4f1555bc-4664-46c3-a606-78d34dd10d92</span></span>
-<span><span class="co">#&gt; 23 2ba40233-8576-4dec-a5f1-2adfa115e2dc</span></span>
-<span><span class="co">#&gt; 24 2423ce2c-3149-4cca-a2ff-cf682ea29b5f</span></span>
-<span><span class="co">#&gt; 25 1c9eb291-6d31-47e1-96b2-129b5e1ae64f</span></span>
-<span><span class="co">#&gt; 26 18eb630b-a754-4111-8cd4-c24ec80aa5ec</span></span>
-<span><span class="co">#&gt; 27 0d2ee4ac-05ee-40b2-afb6-ebb584caa867</span></span>
-<span><span class="co">#&gt; 28 0ced5e76-6040-47ff-8a72-93847965afc0</span></span>
-<span><span class="co">#&gt; 29 0041b9c3-6a49-4bf7-8514-9bc7190067a7</span></span>
-<span><span class="co">#&gt; 30 c8f83821-a242-4ed7-86e9-7da077f5d348</span></span>
-<span><span class="co">#&gt; 31 c05e6940-729c-47bd-a2a6-6ce3730c4919</span></span>
-<span><span class="co">#&gt; 32 894573ad-498f-47ee-9bec-ad0880147eea</span></span>
-<span><span class="co">#&gt; 33 84242d25-f656-4ca6-8e8d-f3d2beeba11f</span></span>
-<span><span class="co">#&gt; 34 3d044b52-140a-4528-bf0d-a2dbef9e1f40</span></span>
-<span><span class="co">#&gt; 35 12194ced-8086-458e-84a8-e2ab935d8db1</span></span>
-<span><span class="co">#&gt; 36 965386e9-1e4f-466d-bf59-ebdca4b66b9b</span></span>
-<span><span class="co">#&gt; 37 e47c65a8-7d2f-48b8-908e-04ea6505fa26</span></span>
-<span><span class="co">#&gt; 38 c8d40d53-387b-48f2-9f89-72bfdb9c7c9f</span></span>
-<span><span class="co">#&gt; 39 a41202e6-173c-477c-8b4d-e0688ee1c4cb</span></span>
-<span><span class="co">#&gt; 40 7f08cbcc-5790-4576-8478-10e9a999b316</span></span>
-<span><span class="co">#&gt; 41 3d0d6923-a2c4-476f-a53e-3b7bfa010d90</span></span>
-<span><span class="co">#&gt; 42 2a7f90de-098a-4a6f-ac07-9e6462792412</span></span>
-<span><span class="co">#&gt; 43 d7291f04-fbbb-4d65-990a-f01fa44e915b</span></span>
-<span><span class="co">#&gt; 44 8e10f1c4-8e98-41e5-b65f-8cd89a887122</span></span>
-<span><span class="co">#&gt; 45 9d8e5dca-03a3-457d-b7fb-844c75735c83</span></span>
-<span><span class="co">#&gt; 46 a6388a6f-6076-401b-9b30-7d4306a20035</span></span>
-<span><span class="co">#&gt; 47 842c6f5d-4a94-4eef-8510-8c792d1124bc</span></span>
-<span><span class="co">#&gt; 48 74520626-b0ba-4ee9-86b5-714649554def</span></span>
-<span><span class="co">#&gt; 49 396a9124-fb20-4822-bf9c-e93fdf7c999a</span></span>
-<span><span class="co">#&gt; 50 e84f2780-51e8-4cfa-8aa0-13bbfef677c7</span></span>
-<span><span class="co">#&gt; 51 dfdf1ae2-d624-4004-9353-f18b902f6bca</span></span>
-<span><span class="co">#&gt; 52 d1cbed97-d88f-4954-8925-13302fe30b39</span></span>
-<span><span class="co">#&gt; 53 b03e4ef8-4e6b-47f4-84a7-e8ed033d08cd</span></span>
-<span><span class="co">#&gt; 54 f1f123cc-ca2c-460f-b7f1-88240efb1e82</span></span>
-<span><span class="co">#&gt; 55 de94c504-4b58-4f42-b68d-74a8e4892f0e</span></span>
-<span><span class="co">#&gt; 56 da684768-fb01-455b-9f0f-b63a3e2f844f</span></span>
-<span><span class="co">#&gt; 57 9f222629-9e39-47d0-b83f-e08d610c7479</span></span>
-<span><span class="co">#&gt; 58 b0e547f0-462b-4f81-b31b-5b0a5d96f537</span></span>
-<span><span class="co">#&gt; 59 d41f45c1-1b7b-4573-a998-ac5c5acb1647</span></span>
-<span><span class="co">#&gt; 60 f801b7a9-80a6-4d09-9161-71474deb58ae</span></span>
-<span><span class="co">#&gt; 61 be39785b-67cb-4177-be19-a40ee3747e45</span></span>
-<span><span class="co">#&gt; 62 4c6f9f26-5470-455b-8933-c408232fbf56</span></span>
-<span><span class="co">#&gt; 63 be35c935-ee4f-475c-9d3c-97630d59a735</span></span>
-<span><span class="co">#&gt; 64 975e13b6-bec1-4eed-b46a-9be1f1357373</span></span>
-<span><span class="co">#&gt; 65 24ec2dc5-3573-4d66-a9e1-25b7dcf43e27</span></span>
-<span><span class="co">#&gt; 66 0ba636a1-4754-4786-a8be-7ab3cf760fd6</span></span>
-<span><span class="co">#&gt; 67 c2876b1b-06d8-4d96-a56b-5304f815b99a</span></span>
-<span><span class="co">#&gt; 68 3f32121d-126b-4e8d-9f69-d86502d2a1b1</span></span>
-<span><span class="co">#&gt; 69 be46dfdc-0f99-4731-8957-64ca37364985</span></span>
-<span><span class="co">#&gt; 70 ac2fea99-ce08-4fca-8d03-a19f37bf21a3</span></span>
-<span><span class="co">#&gt; 71 a13bda79-9134-46c9-9ed1-a2858be9aafe</span></span>
-<span><span class="co">#&gt; 72 5695d556-974e-4d92-9e99-5f61b8695313</span></span>
-<span><span class="co">#&gt; 73 535e9336-2d8d-43c3-944d-bcbebe20df8a</span></span>
-<span><span class="co">#&gt; 74 4fb330ab-2d74-4649-b58f-7ffef457efdf</span></span>
-<span><span class="co">#&gt; 75 290d50c7-7158-4198-acf5-6d4b624fd3dc</span></span>
-<span><span class="co">#&gt; 76 18e2a8c5-33f7-455e-a58a-b2ba6921db27</span></span>
-<span><span class="co">#&gt; 77 12967895-3d58-4e93-be2c-4e1bcf4388d5</span></span>
-<span><span class="co">#&gt; 78 ee195b7d-184d-4dfa-9b1c-51a7e601ac11</span></span>
-<span><span class="co">#&gt; 79 9968be68-ab65-4a38-9e1a-c9b6abece194</span></span>
-<span><span class="co">#&gt; 80 b165f033-9dec-468a-9248-802fc6902a74</span></span>
-<span><span class="co">#&gt; 81 d8da613f-e681-4c69-b463-e94f5e66847f</span></span>
-<span><span class="co">#&gt; 82 fe4b89d5-461e-440c-a5a8-621b37b122c0</span></span>
-<span><span class="co">#&gt; 83 a37f857c-779f-464e-9310-3db43a1811e7</span></span>
-<span><span class="co">#&gt; 84 6cf3634d-e911-44ad-bf52-c747a9af3c01</span></span>
-<span><span class="co">#&gt; 85 5ce42b38-d867-487f-9b40-e8bb00b21d0b</span></span>
-<span><span class="co">#&gt;                                                                                                                                     dataset_title</span></span>
-<span><span class="co">#&gt; 1                                                                                                                          donor_p13_trophoblasts</span></span>
-<span><span class="co">#&gt; 2                                                                                                                         All donors trophoblasts</span></span>
-<span><span class="co">#&gt; 3                                                                                                            All donors all cell states (in vivo)</span></span>
-<span><span class="co">#&gt; 4                                                                            Single-cell transcriptomic datasets of Renal cell carcinoma patients</span></span>
-<span><span class="co">#&gt; 5        Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy</span></span>
-<span><span class="co">#&gt; 6                                                                                                                       Tabula Sapiens - Pancreas</span></span>
-<span><span class="co">#&gt; 7                                                                                                                 Tabula Sapiens - Salivary_Gland</span></span>
-<span><span class="co">#&gt; 8                                                                                                                          Tabula Sapiens - Heart</span></span>
-<span><span class="co">#&gt; 9                                                                                                                        Tabula Sapiens - Bladder</span></span>
-<span><span class="co">#&gt; 10                                                                                                                       Tabula Sapiens - Trachea</span></span>
-<span><span class="co">#&gt; 11                                                                                                                      Tabula Sapiens - Prostate</span></span>
-<span><span class="co">#&gt; 12                                                                                                                        Tabula Sapiens - Spleen</span></span>
-<span><span class="co">#&gt; 13                                                                                                               Tabula Sapiens - Small_Intestine</span></span>
-<span><span class="co">#&gt; 14                                                                                                                   Tabula Sapiens - Vasculature</span></span>
-<span><span class="co">#&gt; 15                                                                                                                           Tabula Sapiens - Eye</span></span>
-<span><span class="co">#&gt; 16                                                                                                                         Tabula Sapiens - Blood</span></span>
-<span><span class="co">#&gt; 17                                                                                                               Tabula Sapiens - Large_Intestine</span></span>
-<span><span class="co">#&gt; 18                                                                                                                        Tabula Sapiens - Uterus</span></span>
-<span><span class="co">#&gt; 19                                                                                                                         Tabula Sapiens - Liver</span></span>
-<span><span class="co">#&gt; 20                                                                                                                           Tabula Sapiens - Fat</span></span>
-<span><span class="co">#&gt; 21                                                                                                                        Tabula Sapiens - Tongue</span></span>
-<span><span class="co">#&gt; 22                                                                                                                   Tabula Sapiens - Bone_Marrow</span></span>
-<span><span class="co">#&gt; 23                                                                                                                       Tabula Sapiens - Mammary</span></span>
-<span><span class="co">#&gt; 24                                                                                                                        Tabula Sapiens - Kidney</span></span>
-<span><span class="co">#&gt; 25                                                                                                                        Tabula Sapiens - Muscle</span></span>
-<span><span class="co">#&gt; 26                                                                                                                    Tabula Sapiens - Lymph_Node</span></span>
-<span><span class="co">#&gt; 27                                                                                                                          Tabula Sapiens - Lung</span></span>
-<span><span class="co">#&gt; 28                                                                                                                        Tabula Sapiens - Thymus</span></span>
-<span><span class="co">#&gt; 29                                                                                                                          Tabula Sapiens - Skin</span></span>
-<span><span class="co">#&gt; 30                                                                                                                      white matter - astrocytes</span></span>
-<span><span class="co">#&gt; 31                                                                                                                       white matter - all cells</span></span>
-<span><span class="co">#&gt; 32                                                                                                                         white matter - neurons</span></span>
-<span><span class="co">#&gt; 33                                                                                                                       white matter - microglia</span></span>
-<span><span class="co">#&gt; 34                                                                                                                  white matter - vascular cells</span></span>
-<span><span class="co">#&gt; 35                                                                                                                 white matter - oligodendroglia</span></span>
-<span><span class="co">#&gt; 36 Single cell RNA sequencing of bone marrow mononuclear cells from healthy donors and B-cell lymphoma patients following CD19 CAR T-cell therapy</span></span>
-<span><span class="co">#&gt; 37                                                                                                                scRNA-seq data - vascular cells</span></span>
-<span><span class="co">#&gt; 38                                                                                                            scRNA-seq data - perivascular cells</span></span>
-<span><span class="co">#&gt; 39                                                                                                               scRNA-seq data - lymphatic cells</span></span>
-<span><span class="co">#&gt; 40                                                                                                                     snRNA-seq data - all cells</span></span>
-<span><span class="co">#&gt; 41                                                                                                                   scRNA-seq data - fibroblasts</span></span>
-<span><span class="co">#&gt; 42                                                                                                              scRNA-seq data - epithelial cells</span></span>
-<span><span class="co">#&gt; 43                                                                               Single-cell RNA-seq for all cortical &amp; hippocampal regions (10x)</span></span>
-<span><span class="co">#&gt; 44                                                                                                                                    All neurons</span></span>
-<span><span class="co">#&gt; 45                                                                                                                          22 integrated samples</span></span>
-<span><span class="co">#&gt; 46                                                                                                                 scRNA-seq data - myeloid cells</span></span>
-<span><span class="co">#&gt; 47                                                                                                                     scRNA-seq data - all cells</span></span>
-<span><span class="co">#&gt; 48                                                                                                                       scRNA-seq data - T cells</span></span>
-<span><span class="co">#&gt; 49                                                                                                                       scRNA-seq data - B cells</span></span>
-<span><span class="co">#&gt; 50                                                                                                             All cells from human liver dataset</span></span>
-<span><span class="co">#&gt; 51                                                                                                         Myeloid cells from human liver dataset</span></span>
-<span><span class="co">#&gt; 52                                                                                                   CD45 negative cells from human liver dataset</span></span>
-<span><span class="co">#&gt; 53                                                                                                        Lymphoid cells from human liver dataset</span></span>
-<span><span class="co">#&gt; 54                                                                                                 UMAP visualization of keratinocyte subclusters</span></span>
-<span><span class="co">#&gt; 55                                                                                                          UMAP visualization of all 12 datasets</span></span>
-<span><span class="co">#&gt; 56                                                                                                   UMAP visualization of fibroblast subclusters</span></span>
-<span><span class="co">#&gt; 57                                                                        An integrated cell atlas of the human lung in health and disease (full)</span></span>
-<span><span class="co">#&gt; 58                                         AIDA Phase 1: Chinese, Indian, Japanese, Korean, and Malay donors in Japan, Singapore, and South Korea</span></span>
-<span><span class="co">#&gt; 59           Transcriptional connectivity of regulatory T cells in the tumor microenvironment informs novel combination cancer therapy strategies</span></span>
-<span><span class="co">#&gt; 60          normal - Single-cell analyses of renal cell cancers reveal insights into tumor microenvironment, cell of origin, and therapy response</span></span>
-<span><span class="co">#&gt; 61           ccRCC - Single-cell analyses of renal cell cancers reveal insights into tumor microenvironment, cell of origin, and therapy response</span></span>
-<span><span class="co">#&gt; 62           chRCC - Single-cell analyses of renal cell cancers reveal insights into tumor microenvironment, cell of origin, and therapy response</span></span>
-<span><span class="co">#&gt; 63                                                                                                                                  HBCA - stroma</span></span>
-<span><span class="co">#&gt; 64                                                                                                                              HBCA - epithelial</span></span>
-<span><span class="co">#&gt; 65                                                                                                                                  HBCA - immune</span></span>
-<span><span class="co">#&gt; 66                                                                                                                                  HBCA - global</span></span>
-<span><span class="co">#&gt; 67                                                                               Whole Taxonomy - MTG: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
-<span><span class="co">#&gt; 68                                                                                                 fetal and neonatal human small intestine cells</span></span>
-<span><span class="co">#&gt; 69                                                                                                                     Mouse Somatic Cell Lineage</span></span>
-<span><span class="co">#&gt; 70                                                                                                                      Human Immune Cell Lineage</span></span>
-<span><span class="co">#&gt; 71                                                                                                                                     Mouse Male</span></span>
-<span><span class="co">#&gt; 72                                                                                                                               Mouse Germ Cells</span></span>
-<span><span class="co">#&gt; 73                                                                                                                                     Human Male</span></span>
-<span><span class="co">#&gt; 74                                                                                                                     Human Somatic Cell Lineage</span></span>
-<span><span class="co">#&gt; 75                                                                                                                               Human Germ Cells</span></span>
-<span><span class="co">#&gt; 76                                                                                                                                   Human Female</span></span>
-<span><span class="co">#&gt; 77                                                                                                                                   Mouse Female</span></span>
-<span><span class="co">#&gt; 78                                                                                                                                 Adult duodenum</span></span>
-<span><span class="co">#&gt; 79                                                                                                                         Developing Human Atlas</span></span>
-<span><span class="co">#&gt; 80                                                                                                                         All non-neuronal cells</span></span>
-<span><span class="co">#&gt; 81                                                                                          A molecular single-cell lung atlas of lethal COVID-19</span></span>
-<span><span class="co">#&gt; 82                                                                                                                                  TI epithelial</span></span>
-<span><span class="co">#&gt; 83                                                                                                                                      TI immune</span></span>
-<span><span class="co">#&gt; 84                                                                                                                                  colon stromal</span></span>
-<span><span class="co">#&gt; 85                                                                                                                               colon epithelial</span></span>
+<span><span class="co">#&gt; 1  2bdd3a2c-2ff4-4314-adf3-8a06b797a33a</span></span>
+<span><span class="co">#&gt; 2  f5b0810c-1664-4a62-ad06-be1d9964aa8b</span></span>
+<span><span class="co">#&gt; 3  e4ddac12-f48f-4455-8e8d-c2a48a683437</span></span>
+<span><span class="co">#&gt; 4  e2808a6e-e2ea-41b9-b38c-4a08f1677f02</span></span>
+<span><span class="co">#&gt; 5  d01c9dff-abd1-4825-bf30-2eb2ba74597e</span></span>
+<span><span class="co">#&gt; 6  c3aa4f95-7a18-4a7d-8dd8-ca324d714363</span></span>
+<span><span class="co">#&gt; 7  be401db3-d732-408a-b0c4-71af0458b8ab</span></span>
+<span><span class="co">#&gt; 8  a5d5c529-8a1f-40b5-bda3-35208970070d</span></span>
+<span><span class="co">#&gt; 9  9c63201d-bfd9-41a8-bbbc-18d947556f3d</span></span>
+<span><span class="co">#&gt; 10 93cb76aa-a84b-4a92-8e6c-66a914e26d4c</span></span>
+<span><span class="co">#&gt; 11 8d1dd010-5cbc-43fb-83f8-e0de8e8517da</span></span>
+<span><span class="co">#&gt; 12 716a4acc-919e-4326-9672-ebe06ede84e6</span></span>
+<span><span class="co">#&gt; 13 5bdc423a-59e6-457d-aa01-debd2c9c564f</span></span>
+<span><span class="co">#&gt; 14 5346f9c6-755e-4336-94cc-38706ec00c2f</span></span>
+<span><span class="co">#&gt; 15 015c230d-650c-4527-870d-8a805849a382</span></span>
+<span><span class="co">#&gt; 16 d567b692-c374-4628-a508-8008f6778f22</span></span>
+<span><span class="co">#&gt; 17 cf83c98a-3791-4537-bbde-a719f6d73c13</span></span>
+<span><span class="co">#&gt; 18 738942eb-ac72-44ff-a64b-8943b5ecd8d9</span></span>
+<span><span class="co">#&gt; 19 f8d8b443-bca6-4c3c-9042-669dfb7f8030</span></span>
+<span><span class="co">#&gt; 20 f5be4b96-f5a3-4c3d-84ac-6f69daf744d5</span></span>
+<span><span class="co">#&gt; 21 dea1aa78-c0a2-413f-b375-f91cce49e4d0</span></span>
+<span><span class="co">#&gt; 22 92161459-9103-4379-ae34-73a38eee1d1d</span></span>
+<span><span class="co">#&gt; 23 5829c7ba-697f-418e-8b98-d605b192dc48</span></span>
+<span><span class="co">#&gt; 24 4dd1cd23-fc4d-4fd1-9709-602540f3ca6f</span></span>
+<span><span class="co">#&gt; 25 2856d06c-0ff9-4e01-bfc9-202b74d0b60f</span></span>
+<span><span class="co">#&gt; 26 251b1a7e-d050-4486-8d50-4c2619eb0f46</span></span>
+<span><span class="co">#&gt; 27 07760522-707a-4a1c-8891-dbd1226d6b27</span></span>
+<span><span class="co">#&gt; 28 9fcb0b73-c734-40a5-be9c-ace7eea401c9</span></span>
+<span><span class="co">#&gt; 29 1a38e762-2465-418f-b81c-6a4bce261c34</span></span>
+<span><span class="co">#&gt; 30 f16a8f4d-bc97-43c5-a2f6-bbda952e4c5c</span></span>
+<span><span class="co">#&gt; 31 94c41723-b2c4-4b59-a49a-64c9b851903e</span></span>
+<span><span class="co">#&gt; 32 6ceeaa86-9ceb-4582-b390-6d4dd6ff0572</span></span>
+<span><span class="co">#&gt; 33 9a64bf99-ebe5-4276-93a8-bee9dff1cd47</span></span>
+<span><span class="co">#&gt; 34 fc0ceb80-d2d9-47c1-9d78-b0e45c64c500</span></span>
+<span><span class="co">#&gt; 35 d0ea3ec4-0f3b-4649-9146-1c0b5f303a55</span></span>
+<span><span class="co">#&gt; 36 b8920ef5-7d22-497b-abca-a7a9eb76d79a</span></span>
+<span><span class="co">#&gt; 37 b1d37bbd-9ae4-4404-b2f9-f2fe66750e4e</span></span>
+<span><span class="co">#&gt; 38 a4e89c26-e8d4-4471-9b06-16a1405880f0</span></span>
+<span><span class="co">#&gt; 39 a190b2e9-3796-4785-9a2f-013e2a9a43e6</span></span>
+<span><span class="co">#&gt; 40 9ff9f9ba-016b-4cbb-8899-45dc20860b8b</span></span>
+<span><span class="co">#&gt; 41 9940f951-3dc0-4579-bbb2-2392786e59a3</span></span>
+<span><span class="co">#&gt; 42 74d584f0-74fc-482e-b944-e76f29c1ab85</span></span>
+<span><span class="co">#&gt; 43 6f7fd0f1-a2ed-4ff1-80d3-33dde731cbc3</span></span>
+<span><span class="co">#&gt; 44 6cda07c7-5d7a-41ba-9799-5bb73da25a60</span></span>
+<span><span class="co">#&gt; 45 646e3e87-e46b-4b12-85b5-8d8589e26088</span></span>
+<span><span class="co">#&gt; 46 6437bc9c-16cb-46c8-8f79-9a7384a0212a</span></span>
+<span><span class="co">#&gt; 47 58c43cc2-e00e-43c4-94eb-8501369264e1</span></span>
+<span><span class="co">#&gt; 48 53bc5729-6202-4351-bc99-1f36139e9dc4</span></span>
+<span><span class="co">#&gt; 49 44c83972-e5d2-4858-ac58-2df9f4bf564b</span></span>
+<span><span class="co">#&gt; 50 2ecc72f8-085f-4e86-8692-771f316c54f6</span></span>
+<span><span class="co">#&gt; 51 2e5a9b5d-d31b-4e9f-a179-d5d70ba459fb</span></span>
+<span><span class="co">#&gt; 52 1c9f5c6b-73da-4d17-95de-df080ffe0df1</span></span>
+<span><span class="co">#&gt; 53 100c6145-7b0e-4ba6-81c1-ffebed0d1ac4</span></span>
+<span><span class="co">#&gt; 54 0ed60482-a34f-4268-b576-d69cc30210f6</span></span>
+<span><span class="co">#&gt; 55 0eccaf0c-19d2-4900-9962-899378adf8be</span></span>
+<span><span class="co">#&gt; 56 04c94a7d-1133-42c9-bb48-c697bd302a8d</span></span>
+<span><span class="co">#&gt; 57 0374f03c-62e2-4859-8a14-acb00b0627d5</span></span>
+<span><span class="co">#&gt; 58 03181d87-4769-41e7-8c39-d9a81835f0d2</span></span>
+<span><span class="co">#&gt; 59 f171db61-e57e-4535-a06a-35d8b6ef8f2b</span></span>
+<span><span class="co">#&gt; 60 ecf2e08e-2032-4a9e-b466-b65b395f4a02</span></span>
+<span><span class="co">#&gt; 61 74cff64f-9da9-4b2a-9b3b-8a04a1598040</span></span>
+<span><span class="co">#&gt; 62 5af90777-6760-4003-9dba-8f945fec6fdf</span></span>
+<span><span class="co">#&gt; 63 bd65a70f-b274-4133-b9dd-0d1431b6af34</span></span>
+<span><span class="co">#&gt; 64 ff45e623-7f5f-46e3-b47d-56be0341f66b</span></span>
+<span><span class="co">#&gt; 65 f01bdd17-4902-40f5-86e3-240d66dd2587</span></span>
+<span><span class="co">#&gt; 66 e6a11140-2545-46bc-929e-da243eed2cae</span></span>
+<span><span class="co">#&gt; 67 e5c63d94-593c-4338-a489-e1048599e751</span></span>
+<span><span class="co">#&gt; 68 d8732da6-8d1d-42d9-b625-f2416c30054b</span></span>
+<span><span class="co">#&gt; 69 d77ec7d6-ef2e-49d6-9e79-05b7f8881484</span></span>
+<span><span class="co">#&gt; 70 cee11228-9f0b-4e57-afe2-cfe15ee56312</span></span>
+<span><span class="co">#&gt; 71 a357414d-2042-4eb5-95f0-c58604a18bdd</span></span>
+<span><span class="co">#&gt; 72 a2d4d33e-4c62-4361-b80a-9be53d2e50e8</span></span>
+<span><span class="co">#&gt; 73 a0754256-f44b-4c4a-962c-a552e47d3fdc</span></span>
+<span><span class="co">#&gt; 74 983d5ec9-40e8-4512-9e65-a572a9c486cb</span></span>
+<span><span class="co">#&gt; 75 7357cee7-9f7f-4ab0-8cec-90de8f047e38</span></span>
+<span><span class="co">#&gt; 76 6ec405bb-4727-4c6d-ab4e-01fe489af7ea</span></span>
+<span><span class="co">#&gt; 77 6d41668c-168c-4500-b06a-4674ccf3e19d</span></span>
+<span><span class="co">#&gt; 78 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c</span></span>
+<span><span class="co">#&gt; 79 55cf0ea3-9d2b-4294-871e-bb4b49a79fc7</span></span>
+<span><span class="co">#&gt; 80 4f1555bc-4664-46c3-a606-78d34dd10d92</span></span>
+<span><span class="co">#&gt; 81 2ba40233-8576-4dec-a5f1-2adfa115e2dc</span></span>
+<span><span class="co">#&gt; 82 2423ce2c-3149-4cca-a2ff-cf682ea29b5f</span></span>
+<span><span class="co">#&gt; 83 1c9eb291-6d31-47e1-96b2-129b5e1ae64f</span></span>
+<span><span class="co">#&gt; 84 18eb630b-a754-4111-8cd4-c24ec80aa5ec</span></span>
+<span><span class="co">#&gt; 85 0d2ee4ac-05ee-40b2-afb6-ebb584caa867</span></span>
+<span><span class="co">#&gt;                                                                                                                               dataset_title</span></span>
+<span><span class="co">#&gt; 1                                                                                                                   Human: Great apes study</span></span>
+<span><span class="co">#&gt; 2                                                                                                           Dissection: Angular gyrus (AnG)</span></span>
+<span><span class="co">#&gt; 3                                                                                                    Supercluster: CGE-derived interneurons</span></span>
+<span><span class="co">#&gt; 4                                                                                                   Dissection: Primary auditory cortex(A1)</span></span>
+<span><span class="co">#&gt; 5                                                                                      Supercluster: Deep layer (non-IT) excitatory neurons</span></span>
+<span><span class="co">#&gt; 6                                                                                            Supercluster: IT-projecting excitatory neurons</span></span>
+<span><span class="co">#&gt; 7                                                                                               Dissection: Anterior cingulate cortex (ACC)</span></span>
+<span><span class="co">#&gt; 8                                                                                                   Human Multiple Cortical Areas SMART-seq</span></span>
+<span><span class="co">#&gt; 9                                                                                                    Supercluster: MGE-derived interneurons</span></span>
+<span><span class="co">#&gt; 10                                                                                            Dissection: Primary somatosensory cortex (S1)</span></span>
+<span><span class="co">#&gt; 11                                                                                                    Dissection: Primary visual cortex(V1)</span></span>
+<span><span class="co">#&gt; 12                                                                                         Dissection: Dorsolateral prefrontal cortex (DFC)</span></span>
+<span><span class="co">#&gt; 13                                                                                                    Dissection: Primary motor cortex (M1)</span></span>
+<span><span class="co">#&gt; 14                                                                                                         Supercluster: Non-neuronal cells</span></span>
+<span><span class="co">#&gt; 15                                                                                                  Dissection: Middle temporal gyrus (MTG)</span></span>
+<span><span class="co">#&gt; 16                                                                       Combined single cell and single nuclei RNA-Seq data - Heart Global</span></span>
+<span><span class="co">#&gt; 17                                                                                                    Global dataset of infant KMT2Ar B-ALL</span></span>
+<span><span class="co">#&gt; 18                                                                                     Normal immune cells landscape of infant KMT2Ar B-ALL</span></span>
+<span><span class="co">#&gt; 19                                                                                                      Human Human Microglia 10x scRNA-seq</span></span>
+<span><span class="co">#&gt; 20                                                                                                    Human Endothelial cells 10x scRNA-seq</span></span>
+<span><span class="co">#&gt; 21                                                                                                 Human Nurr-Negative Nuclei 10x scRNA-seq</span></span>
+<span><span class="co">#&gt; 22                                                                                                 Human Nurr-Positive Nuclei 10x scRNA-seq</span></span>
+<span><span class="co">#&gt; 23                                                                                                     Human Oligodendrocytes 10x scRNA-seq</span></span>
+<span><span class="co">#&gt; 24                                                                                                            Human OPC Cells 10x scRNA-seq</span></span>
+<span><span class="co">#&gt; 25                                                                                                           Human DA Neurons 10x scRNA-seq</span></span>
+<span><span class="co">#&gt; 26                                                                                                       Human Non-DA Neurons 10x scRNA-seq</span></span>
+<span><span class="co">#&gt; 27                                                                                                           Human Astrocytes 10x scRNA-seq</span></span>
+<span><span class="co">#&gt; 28                                                                              An Integrated Single Cell Meta-atlas of Human Periodontitis</span></span>
+<span><span class="co">#&gt; 29                                                                Single-cell analysis of prenatal and postnatal human cortical development</span></span>
+<span><span class="co">#&gt; 30                                                       All - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse</span></span>
+<span><span class="co">#&gt; 31                                                                                    snRNA-seq of human anterior and posterior hippocampus</span></span>
+<span><span class="co">#&gt; 32                                                                                                                        3-prime FGID data</span></span>
+<span><span class="co">#&gt; 33                                                      Single-Cell RNA Sequencing of Breast Tissues: Cell Subtypes and Cancer Risk Factors</span></span>
+<span><span class="co">#&gt; 34                                                                            Sst Chodl - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 35                                                                                  L6b - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 36                                                                              L5/6 NP - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 37                                                                                 Sncg - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 38                                                                                L6 CT - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 39                                                                           Lamp5 Lhx6 - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 40                                                                                L4 IT - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 41                                                                      Oligodendrocyte - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 42                                                                            Astrocyte - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 43                                                                       Whole Taxonomy - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 44                                                                                L5 ET - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 45                                                                              L2/3 IT - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 46                                                                                L6 IT - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 47                                                                                  OPC - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 48                                                                                  Vip - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 49                                                                                L5 IT - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 50                                                                          Endothelial - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 51                                                                                 VLMC - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 52                                                                           L6 IT Car3 - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 53                                                                        Microglia-PVM - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 54                                                                                Lamp5 - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 55                                                                                 Pax6 - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 56                                                                                Pvalb - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 57                                                                           Chandelier - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 58                                                                                  Sst - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD)</span></span>
+<span><span class="co">#&gt; 59                                                                                                                   donor_p13_trophoblasts</span></span>
+<span><span class="co">#&gt; 60                                                                                                                  All donors trophoblasts</span></span>
+<span><span class="co">#&gt; 61                                                                                                     All donors all cell states (in vivo)</span></span>
+<span><span class="co">#&gt; 62                                                                     Single-cell transcriptomic datasets of Renal cell carcinoma patients</span></span>
+<span><span class="co">#&gt; 63 Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy</span></span>
+<span><span class="co">#&gt; 64                                                                                                                Tabula Sapiens - Pancreas</span></span>
+<span><span class="co">#&gt; 65                                                                                                          Tabula Sapiens - Salivary_Gland</span></span>
+<span><span class="co">#&gt; 66                                                                                                                   Tabula Sapiens - Heart</span></span>
+<span><span class="co">#&gt; 67                                                                                                                 Tabula Sapiens - Bladder</span></span>
+<span><span class="co">#&gt; 68                                                                                                                 Tabula Sapiens - Trachea</span></span>
+<span><span class="co">#&gt; 69                                                                                                                Tabula Sapiens - Prostate</span></span>
+<span><span class="co">#&gt; 70                                                                                                                  Tabula Sapiens - Spleen</span></span>
+<span><span class="co">#&gt; 71                                                                                                         Tabula Sapiens - Small_Intestine</span></span>
+<span><span class="co">#&gt; 72                                                                                                             Tabula Sapiens - Vasculature</span></span>
+<span><span class="co">#&gt; 73                                                                                                                     Tabula Sapiens - Eye</span></span>
+<span><span class="co">#&gt; 74                                                                                                                   Tabula Sapiens - Blood</span></span>
+<span><span class="co">#&gt; 75                                                                                                         Tabula Sapiens - Large_Intestine</span></span>
+<span><span class="co">#&gt; 76                                                                                                                  Tabula Sapiens - Uterus</span></span>
+<span><span class="co">#&gt; 77                                                                                                                   Tabula Sapiens - Liver</span></span>
+<span><span class="co">#&gt; 78                                                                                                                     Tabula Sapiens - Fat</span></span>
+<span><span class="co">#&gt; 79                                                                                                                  Tabula Sapiens - Tongue</span></span>
+<span><span class="co">#&gt; 80                                                                                                             Tabula Sapiens - Bone_Marrow</span></span>
+<span><span class="co">#&gt; 81                                                                                                                 Tabula Sapiens - Mammary</span></span>
+<span><span class="co">#&gt; 82                                                                                                                  Tabula Sapiens - Kidney</span></span>
+<span><span class="co">#&gt; 83                                                                                                                  Tabula Sapiens - Muscle</span></span>
+<span><span class="co">#&gt; 84                                                                                                              Tabula Sapiens - Lymph_Node</span></span>
+<span><span class="co">#&gt; 85                                                                                                                    Tabula Sapiens - Lung</span></span>
 <span><span class="co">#&gt;    dataset_total_cell_count</span></span>
-<span><span class="co">#&gt; 1                     31497</span></span>
-<span><span class="co">#&gt; 2                     67070</span></span>
-<span><span class="co">#&gt; 3                    286326</span></span>
-<span><span class="co">#&gt; 4                    270855</span></span>
-<span><span class="co">#&gt; 5                    167283</span></span>
-<span><span class="co">#&gt; 6                     13497</span></span>
-<span><span class="co">#&gt; 7                     27199</span></span>
-<span><span class="co">#&gt; 8                     11505</span></span>
-<span><span class="co">#&gt; 9                     24583</span></span>
-<span><span class="co">#&gt; 10                     9522</span></span>
-<span><span class="co">#&gt; 11                    16375</span></span>
-<span><span class="co">#&gt; 12                    34004</span></span>
-<span><span class="co">#&gt; 13                    12467</span></span>
-<span><span class="co">#&gt; 14                    16037</span></span>
-<span><span class="co">#&gt; 15                    10650</span></span>
-<span><span class="co">#&gt; 16                    50115</span></span>
-<span><span class="co">#&gt; 17                    13680</span></span>
-<span><span class="co">#&gt; 18                     7124</span></span>
-<span><span class="co">#&gt; 19                     5007</span></span>
-<span><span class="co">#&gt; 20                    20263</span></span>
-<span><span class="co">#&gt; 21                    15020</span></span>
-<span><span class="co">#&gt; 22                    12297</span></span>
-<span><span class="co">#&gt; 23                    11375</span></span>
-<span><span class="co">#&gt; 24                     9641</span></span>
-<span><span class="co">#&gt; 25                    30746</span></span>
-<span><span class="co">#&gt; 26                    53275</span></span>
-<span><span class="co">#&gt; 27                    35682</span></span>
-<span><span class="co">#&gt; 28                    33664</span></span>
-<span><span class="co">#&gt; 29                     9424</span></span>
-<span><span class="co">#&gt; 30                     3596</span></span>
-<span><span class="co">#&gt; 31                    45528</span></span>
-<span><span class="co">#&gt; 32                    10734</span></span>
-<span><span class="co">#&gt; 33                     3851</span></span>
-<span><span class="co">#&gt; 34                     4880</span></span>
-<span><span class="co">#&gt; 35                    21968</span></span>
-<span><span class="co">#&gt; 36                    92676</span></span>
-<span><span class="co">#&gt; 37                    83651</span></span>
-<span><span class="co">#&gt; 38                    52638</span></span>
-<span><span class="co">#&gt; 39                     8982</span></span>
-<span><span class="co">#&gt; 40                   117346</span></span>
-<span><span class="co">#&gt; 41                   208390</span></span>
-<span><span class="co">#&gt; 42                   240804</span></span>
-<span><span class="co">#&gt; 43                  1169213</span></span>
-<span><span class="co">#&gt; 44                  2480956</span></span>
-<span><span class="co">#&gt; 45                    72335</span></span>
-<span><span class="co">#&gt; 46                    30789</span></span>
-<span><span class="co">#&gt; 47                   714331</span></span>
-<span><span class="co">#&gt; 48                    76567</span></span>
-<span><span class="co">#&gt; 49                    12510</span></span>
-<span><span class="co">#&gt; 50                   167598</span></span>
-<span><span class="co">#&gt; 51                    40821</span></span>
-<span><span class="co">#&gt; 52                    15481</span></span>
-<span><span class="co">#&gt; 53                   105790</span></span>
-<span><span class="co">#&gt; 54                     9471</span></span>
-<span><span class="co">#&gt; 55                    15243</span></span>
-<span><span class="co">#&gt; 56                     2303</span></span>
-<span><span class="co">#&gt; 57                  2282447</span></span>
-<span><span class="co">#&gt; 58                  1058909</span></span>
-<span><span class="co">#&gt; 59                    82991</span></span>
-<span><span class="co">#&gt; 60                     6044</span></span>
-<span><span class="co">#&gt; 61                    20509</span></span>
-<span><span class="co">#&gt; 62                     2576</span></span>
-<span><span class="co">#&gt; 63                   413997</span></span>
-<span><span class="co">#&gt; 64                   353167</span></span>
-<span><span class="co">#&gt; 65                    23714</span></span>
-<span><span class="co">#&gt; 66                   800198</span></span>
-<span><span class="co">#&gt; 67                  1226855</span></span>
-<span><span class="co">#&gt; 68                    36359</span></span>
-<span><span class="co">#&gt; 69                    50933</span></span>
-<span><span class="co">#&gt; 70                    20556</span></span>
-<span><span class="co">#&gt; 71                    32889</span></span>
-<span><span class="co">#&gt; 72                    10411</span></span>
-<span><span class="co">#&gt; 73                   133811</span></span>
-<span><span class="co">#&gt; 74                   191230</span></span>
-<span><span class="co">#&gt; 75                    10993</span></span>
-<span><span class="co">#&gt; 76                   213898</span></span>
-<span><span class="co">#&gt; 77                    69709</span></span>
-<span><span class="co">#&gt; 78                     5200</span></span>
-<span><span class="co">#&gt; 79                   155232</span></span>
-<span><span class="co">#&gt; 80                   888263</span></span>
-<span><span class="co">#&gt; 81                   116313</span></span>
-<span><span class="co">#&gt; 82                   154136</span></span>
-<span><span class="co">#&gt; 83                   201072</span></span>
-<span><span class="co">#&gt; 84                    39433</span></span>
-<span><span class="co">#&gt; 85                    97788</span></span>
-<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 508 rows ]</span></span></code></pre></div>
+<span><span class="co">#&gt; 1                    156285</span></span>
+<span><span class="co">#&gt; 2                    110752</span></span>
+<span><span class="co">#&gt; 3                    129495</span></span>
+<span><span class="co">#&gt; 4                    139054</span></span>
+<span><span class="co">#&gt; 5                     92969</span></span>
+<span><span class="co">#&gt; 6                    638941</span></span>
+<span><span class="co">#&gt; 7                    135462</span></span>
+<span><span class="co">#&gt; 8                     49417</span></span>
+<span><span class="co">#&gt; 9                    185477</span></span>
+<span><span class="co">#&gt; 10                   153159</span></span>
+<span><span class="co">#&gt; 11                   241077</span></span>
+<span><span class="co">#&gt; 12                   113339</span></span>
+<span><span class="co">#&gt; 13                   114605</span></span>
+<span><span class="co">#&gt; 14                   108940</span></span>
+<span><span class="co">#&gt; 15                   148374</span></span>
+<span><span class="co">#&gt; 16                   493236</span></span>
+<span><span class="co">#&gt; 17                   128588</span></span>
+<span><span class="co">#&gt; 18                    36313</span></span>
+<span><span class="co">#&gt; 19                    33041</span></span>
+<span><span class="co">#&gt; 20                    14903</span></span>
+<span><span class="co">#&gt; 21                   104097</span></span>
+<span><span class="co">#&gt; 22                    80576</span></span>
+<span><span class="co">#&gt; 23                   178815</span></span>
+<span><span class="co">#&gt; 24                    13691</span></span>
+<span><span class="co">#&gt; 25                    22048</span></span>
+<span><span class="co">#&gt; 26                    91479</span></span>
+<span><span class="co">#&gt; 27                    33506</span></span>
+<span><span class="co">#&gt; 28                   105918</span></span>
+<span><span class="co">#&gt; 29                   700391</span></span>
+<span><span class="co">#&gt; 30                   356213</span></span>
+<span><span class="co">#&gt; 31                   129905</span></span>
+<span><span class="co">#&gt; 32                    89849</span></span>
+<span><span class="co">#&gt; 33                    52681</span></span>
+<span><span class="co">#&gt; 34                     1772</span></span>
+<span><span class="co">#&gt; 35                    17996</span></span>
+<span><span class="co">#&gt; 36                    18154</span></span>
+<span><span class="co">#&gt; 37                    23640</span></span>
+<span><span class="co">#&gt; 38                    27454</span></span>
+<span><span class="co">#&gt; 39                    21603</span></span>
+<span><span class="co">#&gt; 40                    76195</span></span>
+<span><span class="co">#&gt; 41                   136076</span></span>
+<span><span class="co">#&gt; 42                    82936</span></span>
+<span><span class="co">#&gt; 43                  1309414</span></span>
+<span><span class="co">#&gt; 44                     3848</span></span>
+<span><span class="co">#&gt; 45                   317116</span></span>
+<span><span class="co">#&gt; 46                    44174</span></span>
+<span><span class="co">#&gt; 47                    27670</span></span>
+<span><span class="co">#&gt; 48                    95014</span></span>
+<span><span class="co">#&gt; 49                    97173</span></span>
+<span><span class="co">#&gt; 50                     2496</span></span>
+<span><span class="co">#&gt; 51                     4619</span></span>
+<span><span class="co">#&gt; 52                    13007</span></span>
+<span><span class="co">#&gt; 53                    40625</span></span>
+<span><span class="co">#&gt; 54                    52828</span></span>
+<span><span class="co">#&gt; 55                     8984</span></span>
+<span><span class="co">#&gt; 56                   109618</span></span>
+<span><span class="co">#&gt; 57                    14871</span></span>
+<span><span class="co">#&gt; 58                    71545</span></span>
+<span><span class="co">#&gt; 59                    31497</span></span>
+<span><span class="co">#&gt; 60                    67070</span></span>
+<span><span class="co">#&gt; 61                   286326</span></span>
+<span><span class="co">#&gt; 62                   270855</span></span>
+<span><span class="co">#&gt; 63                   167283</span></span>
+<span><span class="co">#&gt; 64                    13497</span></span>
+<span><span class="co">#&gt; 65                    27199</span></span>
+<span><span class="co">#&gt; 66                    11505</span></span>
+<span><span class="co">#&gt; 67                    24583</span></span>
+<span><span class="co">#&gt; 68                     9522</span></span>
+<span><span class="co">#&gt; 69                    16375</span></span>
+<span><span class="co">#&gt; 70                    34004</span></span>
+<span><span class="co">#&gt; 71                    12467</span></span>
+<span><span class="co">#&gt; 72                    16037</span></span>
+<span><span class="co">#&gt; 73                    10650</span></span>
+<span><span class="co">#&gt; 74                    50115</span></span>
+<span><span class="co">#&gt; 75                    13680</span></span>
+<span><span class="co">#&gt; 76                     7124</span></span>
+<span><span class="co">#&gt; 77                     5007</span></span>
+<span><span class="co">#&gt; 78                    20263</span></span>
+<span><span class="co">#&gt; 79                    15020</span></span>
+<span><span class="co">#&gt; 80                    12297</span></span>
+<span><span class="co">#&gt; 81                    11375</span></span>
+<span><span class="co">#&gt; 82                     9641</span></span>
+<span><span class="co">#&gt; 83                    30746</span></span>
+<span><span class="co">#&gt; 84                    53275</span></span>
+<span><span class="co">#&gt; 85                    35682</span></span>
+<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 566 rows ]</span></span></code></pre></div>
 <p>The sum of cell counts across all datasets should match the number of cells across all SOMA experiments (human, mouse).</p>
 <div class="sourceCode" id="cb3"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">census_data</span> <span class="op">&lt;-</span> <span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_data"</span><span class="op">)</span></span>
@@ -401,13 +403,13 @@ <h2 id="fetching-the-datasets-table">Fetching the datasets table<a class="anchor
 <span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="va">all_experiments</span><span class="op">)</span></span>
 <span><span class="co">#&gt; $homo_sapiens</span></span>
 <span><span class="co">#&gt; &lt;SOMAExperiment&gt;</span></span>
-<span><span class="co">#&gt;   uri: s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/census_data/homo_sapiens </span></span>
+<span><span class="co">#&gt;   uri: s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/census_data/homo_sapiens </span></span>
 <span><span class="co">#&gt;   arrays: obs* </span></span>
 <span><span class="co">#&gt;   groups: ms* </span></span>
 <span><span class="co">#&gt; </span></span>
 <span><span class="co">#&gt; $mus_musculus</span></span>
 <span><span class="co">#&gt; &lt;SOMAExperiment&gt;</span></span>
-<span><span class="co">#&gt;   uri: s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/census_data/mus_musculus </span></span>
+<span><span class="co">#&gt;   uri: s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/census_data/mus_musculus </span></span>
 <span><span class="co">#&gt;   arrays: obs* </span></span>
 <span><span class="co">#&gt;   groups: ms*</span></span></code></pre></div>
 <div class="sourceCode" id="cb4"><pre class="downlit sourceCode r">
@@ -416,12 +418,12 @@ <h2 id="fetching-the-datasets-table">Fetching the datasets table<a class="anchor
 <span><span class="op">}</span><span class="op">)</span><span class="op">)</span></span>
 <span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/paste.html" class="external-link">paste</a></span><span class="op">(</span><span class="st">"Found"</span>, <span class="va">experiments_total_cells</span>, <span class="st">"cells in all experiments."</span><span class="op">)</span><span class="op">)</span></span>
-<span><span class="co">#&gt; [1] "Found 61656118 cells in all experiments."</span></span>
+<span><span class="co">#&gt; [1] "Found 68683222 cells in all experiments."</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/paste.html" class="external-link">paste</a></span><span class="op">(</span></span>
 <span>  <span class="st">"Found"</span>, <span class="fu"><a href="https://rdrr.io/r/base/sum.html" class="external-link">sum</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/vector.html" class="external-link">as.vector</a></span><span class="op">(</span><span class="va">census_datasets</span><span class="op">$</span><span class="va">dataset_total_cell_count</span><span class="op">)</span><span class="op">)</span>,</span>
 <span>  <span class="st">"cells in all datasets."</span></span>
 <span><span class="op">)</span><span class="op">)</span></span>
-<span><span class="co">#&gt; [1] "Found 61656118 cells in all datasets."</span></span></code></pre></div>
+<span><span class="co">#&gt; [1] "Found 68683222 cells in all datasets."</span></span></code></pre></div>
 </div>
 <div class="section level2">
 <h2 id="fetching-the-expression-data-from-a-single-dataset">Fetching the expression data from a single dataset<a class="anchor" aria-label="anchor" href="#fetching-the-expression-data-from-a-single-dataset"></a>
@@ -430,13 +432,15 @@ <h2 id="fetching-the-expression-data-from-a-single-dataset">Fetching the express
 <div class="sourceCode" id="cb5"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">census_datasets</span><span class="op">[</span><span class="va">census_datasets</span><span class="op">$</span><span class="va">dataset_id</span> <span class="op">==</span> <span class="st">"0bd1a1de-3aee-40e0-b2ec-86c7a30c7149"</span>, <span class="op">]</span></span>
 <span><span class="co">#&gt;     soma_joinid                        collection_id    collection_name</span></span>
-<span><span class="co">#&gt; 523         522 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis</span></span>
+<span><span class="co">#&gt; 581         580 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis</span></span>
 <span><span class="co">#&gt;                collection_doi                           dataset_id</span></span>
-<span><span class="co">#&gt; 523 10.1038/s41586-020-2496-1 0bd1a1de-3aee-40e0-b2ec-86c7a30c7149</span></span>
+<span><span class="co">#&gt; 581 10.1038/s41586-020-2496-1 0bd1a1de-3aee-40e0-b2ec-86c7a30c7149</span></span>
+<span><span class="co">#&gt;                       dataset_version_id</span></span>
+<span><span class="co">#&gt; 581 ff352f35-58a2-4962-b716-649d1f9e9f44</span></span>
 <span><span class="co">#&gt;                                                                                        dataset_title</span></span>
-<span><span class="co">#&gt; 523 Bone marrow - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - 10x</span></span>
+<span><span class="co">#&gt; 581 Bone marrow - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - 10x</span></span>
 <span><span class="co">#&gt;                             dataset_h5ad_path dataset_total_cell_count</span></span>
-<span><span class="co">#&gt; 523 0bd1a1de-3aee-40e0-b2ec-86c7a30c7149.h5ad                    40220</span></span></code></pre></div>
+<span><span class="co">#&gt; 581 0bd1a1de-3aee-40e0-b2ec-86c7a30c7149.h5ad                    40220</span></span></code></pre></div>
 <p>Create a query on the mouse experiment, “RNA” measurement, for the <code>dataset_id</code>.</p>
 <div class="sourceCode" id="cb6"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="st"><a href="https://github.com/single-cell-data/TileDB-SOMA" class="external-link">"tiledbsoma"</a></span><span class="op">)</span></span>
@@ -450,9 +454,10 @@ <h2 id="fetching-the-expression-data-from-a-single-dataset">Fetching the express
 <span><span class="va">dataset_seurat</span> <span class="op">&lt;-</span> <span class="va">expt_query</span><span class="op">$</span><span class="fu">to_seurat</span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span>counts <span class="op">=</span> <span class="st">"raw"</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="va">dataset_seurat</span><span class="op">)</span></span>
 <span><span class="co">#&gt; An object of class Seurat </span></span>
-<span><span class="co">#&gt; 52392 features across 40220 samples within 1 assay </span></span>
-<span><span class="co">#&gt; Active assay: RNA (52392 features, 0 variable features)</span></span>
-<span><span class="co">#&gt;  2 layers present: counts, data</span></span></code></pre></div>
+<span><span class="co">#&gt; 52417 features across 40220 samples within 1 assay </span></span>
+<span><span class="co">#&gt; Active assay: RNA (52417 features, 0 variable features)</span></span>
+<span><span class="co">#&gt;  2 layers present: counts, data</span></span>
+<span><span class="co">#&gt;  1 dimensional reduction calculated: scvi</span></span></code></pre></div>
 </div>
 <div class="section level2">
 <h2 id="downloading-the-original-source-h5ad-file-of-a-dataset">Downloading the original source H5AD file of a dataset<a class="anchor" aria-label="anchor" href="#downloading-the-original-source-h5ad-file-of-a-dataset"></a>
@@ -470,7 +475,7 @@ <h2 id="downloading-the-original-source-h5ad-file-of-a-dataset">Downloading the
 <code class="sourceCode R"><span><span class="co"># Option 2: Get location and download via preferred method</span></span>
 <span><span class="fu"><a href="../reference/get_source_h5ad_uri.html">get_source_h5ad_uri</a></span><span class="op">(</span><span class="st">"0bd1a1de-3aee-40e0-b2ec-86c7a30c7149"</span><span class="op">)</span></span>
 <span><span class="co">#&gt; $uri</span></span>
-<span><span class="co">#&gt; [1] "s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/h5ads/0bd1a1de-3aee-40e0-b2ec-86c7a30c7149.h5ad"</span></span>
+<span><span class="co">#&gt; [1] "s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/h5ads/0bd1a1de-3aee-40e0-b2ec-86c7a30c7149.h5ad"</span></span>
 <span><span class="co">#&gt; </span></span>
 <span><span class="co">#&gt; $s3_region</span></span>
 <span><span class="co">#&gt; [1] "us-west-2"</span></span></code></pre></div>
diff --git a/r/articles/census_query_extract.html b/r/articles/census_query_extract.html
index 070e64b66..2cdcc033b 100644
--- a/r/articles/census_query_extract.html
+++ b/r/articles/census_query_extract.html
@@ -61,6 +61,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -162,112 +163,96 @@ <h2 id="querying-cell-metadata-obs">Querying cell metadata (obs)<a class="anchor
 <span><span class="co">#&gt; [18] "tissue"                                  </span></span>
 <span><span class="co">#&gt; [19] "tissue_ontology_term_id"                 </span></span>
 <span><span class="co">#&gt; [20] "tissue_general"                          </span></span>
-<span><span class="co">#&gt; [21] "tissue_general_ontology_term_id"</span></span></code></pre></div>
+<span><span class="co">#&gt; [21] "tissue_general_ontology_term_id"         </span></span>
+<span><span class="co">#&gt; [22] "raw_sum"                                 </span></span>
+<span><span class="co">#&gt; [23] "nnz"                                     </span></span>
+<span><span class="co">#&gt; [24] "raw_mean_nnz"                            </span></span>
+<span><span class="co">#&gt; [25] "raw_variance_nnz"                        </span></span>
+<span><span class="co">#&gt; [26] "n_measured_vars"</span></span></code></pre></div>
 <p><code>soma_joinid</code> is a special <code>SOMADataFrame</code> column that is used for join operations. The definition for all other columns can be found at the <a href="https://chanzuckerberg.github.io/cellxgene-census/cellxgene_census_docsite_schema.html" class="external-link">Census schema</a>.</p>
 <p>All of these can be used to fetch specific columns or specific rows matching a condition. For the latter we need to know the values we are looking for <em>a priori</em>.</p>
 <p>For example let’s see what are the possible values available for <code>sex</code>. To this we can load all cell metadata but fetching only for the column <code>sex</code>.</p>
 <div class="sourceCode" id="cb3"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/base/unique.html" class="external-link">unique</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_data"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"homo_sapiens"</span><span class="op">)</span><span class="op">$</span><span class="va">obs</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span>column_names <span class="op">=</span> <span class="st">"sex"</span><span class="op">)</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span><span class="op">)</span><span class="op">)</span></span>
-<span><span class="co">#&gt;            sex</span></span>
-<span><span class="co">#&gt; 1      unknown</span></span>
-<span><span class="co">#&gt; 670     female</span></span>
-<span><span class="co">#&gt; 385438    male</span></span></code></pre></div>
+<span><span class="co">#&gt;             sex</span></span>
+<span><span class="co">#&gt; 1          male</span></span>
+<span><span class="co">#&gt; 224      female</span></span>
+<span><span class="co">#&gt; 3747640 unknown</span></span></code></pre></div>
 <p>As you can see there are only three different values for sex, that is <code>"male"</code>, <code>"female"</code> and <code>"unknown"</code>.</p>
 <p>With this information we can fetch all cell metatadata for a specific sex value, for example <code>"unknown"</code>.</p>
 <div class="sourceCode" id="cb4"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_data"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"homo_sapiens"</span><span class="op">)</span><span class="op">$</span><span class="va">obs</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span>value_filter <span class="op">=</span> <span class="st">"sex == 'unknown'"</span><span class="op">)</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span><span class="op">)</span></span>
-<span><span class="co">#&gt;    soma_joinid                           dataset_id     assay assay_ontology_term_id</span></span>
-<span><span class="co">#&gt; 1            0 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt; 2            1 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt; 3            2 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt; 4            3 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt; 5            4 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt; 6            5 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt; 7            6 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt; 8            7 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt; 9            8 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt; 10           9 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt; 11          10 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt; 12          11 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922</span></span>
-<span><span class="co">#&gt;                        cell_type cell_type_ontology_term_id</span></span>
-<span><span class="co">#&gt; 1       syncytiotrophoblast cell                 CL:0000525</span></span>
-<span><span class="co">#&gt; 2  placental villous trophoblast                 CL:2000060</span></span>
-<span><span class="co">#&gt; 3       syncytiotrophoblast cell                 CL:0000525</span></span>
-<span><span class="co">#&gt; 4       syncytiotrophoblast cell                 CL:0000525</span></span>
-<span><span class="co">#&gt; 5       extravillous trophoblast                 CL:0008036</span></span>
-<span><span class="co">#&gt; 6  placental villous trophoblast                 CL:2000060</span></span>
-<span><span class="co">#&gt; 7       syncytiotrophoblast cell                 CL:0000525</span></span>
-<span><span class="co">#&gt; 8       extravillous trophoblast                 CL:0008036</span></span>
-<span><span class="co">#&gt; 9  placental villous trophoblast                 CL:2000060</span></span>
-<span><span class="co">#&gt; 10      syncytiotrophoblast cell                 CL:0000525</span></span>
-<span><span class="co">#&gt; 11      syncytiotrophoblast cell                 CL:0000525</span></span>
-<span><span class="co">#&gt; 12      syncytiotrophoblast cell                 CL:0000525</span></span>
-<span><span class="co">#&gt;                          development_stage development_stage_ontology_term_id disease</span></span>
-<span><span class="co">#&gt; 1  9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt; 2  9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt; 3  9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt; 4  9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt; 5  9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt; 6  9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt; 7  9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt; 8  9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt; 9  9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt; 10 9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt; 11 9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt; 12 9th week post-fertilization human stage                     HsapDv:0000046  normal</span></span>
-<span><span class="co">#&gt;    disease_ontology_term_id  donor_id is_primary_data self_reported_ethnicity</span></span>
-<span><span class="co">#&gt; 1              PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt; 2              PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt; 3              PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt; 4              PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt; 5              PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt; 6              PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt; 7              PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt; 8              PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt; 9              PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt; 10             PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt; 11             PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt; 12             PATO:0000461 P13_fetus           FALSE                 unknown</span></span>
-<span><span class="co">#&gt;    self_reported_ethnicity_ontology_term_id     sex sex_ontology_term_id</span></span>
-<span><span class="co">#&gt; 1                                   unknown unknown              unknown</span></span>
-<span><span class="co">#&gt; 2                                   unknown unknown              unknown</span></span>
-<span><span class="co">#&gt; 3                                   unknown unknown              unknown</span></span>
-<span><span class="co">#&gt; 4                                   unknown unknown              unknown</span></span>
-<span><span class="co">#&gt; 5                                   unknown unknown              unknown</span></span>
-<span><span class="co">#&gt; 6                                   unknown unknown              unknown</span></span>
-<span><span class="co">#&gt; 7                                   unknown unknown              unknown</span></span>
-<span><span class="co">#&gt; 8                                   unknown unknown              unknown</span></span>
-<span><span class="co">#&gt; 9                                   unknown unknown              unknown</span></span>
-<span><span class="co">#&gt; 10                                  unknown unknown              unknown</span></span>
-<span><span class="co">#&gt; 11                                  unknown unknown              unknown</span></span>
-<span><span class="co">#&gt; 12                                  unknown unknown              unknown</span></span>
-<span><span class="co">#&gt;    suspension_type          tissue tissue_ontology_term_id tissue_general</span></span>
-<span><span class="co">#&gt; 1          nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt; 2          nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt; 3          nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt; 4          nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt; 5          nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt; 6          nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt; 7          nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt; 8          nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt; 9          nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt; 10         nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt; 11         nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt; 12         nucleus decidua basalis          UBERON:0000453       placenta</span></span>
-<span><span class="co">#&gt;    tissue_general_ontology_term_id</span></span>
-<span><span class="co">#&gt; 1                   UBERON:0001987</span></span>
-<span><span class="co">#&gt; 2                   UBERON:0001987</span></span>
-<span><span class="co">#&gt; 3                   UBERON:0001987</span></span>
-<span><span class="co">#&gt; 4                   UBERON:0001987</span></span>
-<span><span class="co">#&gt; 5                   UBERON:0001987</span></span>
-<span><span class="co">#&gt; 6                   UBERON:0001987</span></span>
-<span><span class="co">#&gt; 7                   UBERON:0001987</span></span>
-<span><span class="co">#&gt; 8                   UBERON:0001987</span></span>
-<span><span class="co">#&gt; 9                   UBERON:0001987</span></span>
-<span><span class="co">#&gt; 10                  UBERON:0001987</span></span>
-<span><span class="co">#&gt; 11                  UBERON:0001987</span></span>
-<span><span class="co">#&gt; 12                  UBERON:0001987</span></span>
-<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 3251322 rows ]</span></span></code></pre></div>
+<span><span class="co">#&gt;   soma_joinid                           dataset_id     assay assay_ontology_term_id</span></span>
+<span><span class="co">#&gt; 1     3747639 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899</span></span>
+<span><span class="co">#&gt; 2     3747640 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899</span></span>
+<span><span class="co">#&gt; 3     3747641 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899</span></span>
+<span><span class="co">#&gt; 4     3747642 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899</span></span>
+<span><span class="co">#&gt; 5     3747643 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899</span></span>
+<span><span class="co">#&gt; 6     3747644 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899</span></span>
+<span><span class="co">#&gt; 7     3747645 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899</span></span>
+<span><span class="co">#&gt; 8     3747646 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899</span></span>
+<span><span class="co">#&gt; 9     3747647 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899</span></span>
+<span><span class="co">#&gt;    cell_type cell_type_ontology_term_id development_stage</span></span>
+<span><span class="co">#&gt; 1 fibroblast                 CL:0000057 human adult stage</span></span>
+<span><span class="co">#&gt; 2 fibroblast                 CL:0000057 human adult stage</span></span>
+<span><span class="co">#&gt; 3 fibroblast                 CL:0000057 human adult stage</span></span>
+<span><span class="co">#&gt; 4 fibroblast                 CL:0000057 human adult stage</span></span>
+<span><span class="co">#&gt; 5 fibroblast                 CL:0000057 human adult stage</span></span>
+<span><span class="co">#&gt; 6 fibroblast                 CL:0000057 human adult stage</span></span>
+<span><span class="co">#&gt; 7 fibroblast                 CL:0000057 human adult stage</span></span>
+<span><span class="co">#&gt; 8 fibroblast                 CL:0000057 human adult stage</span></span>
+<span><span class="co">#&gt; 9 fibroblast                 CL:0000057 human adult stage</span></span>
+<span><span class="co">#&gt;   development_stage_ontology_term_id disease disease_ontology_term_id</span></span>
+<span><span class="co">#&gt; 1                     HsapDv:0000087  normal             PATO:0000461</span></span>
+<span><span class="co">#&gt; 2                     HsapDv:0000087  normal             PATO:0000461</span></span>
+<span><span class="co">#&gt; 3                     HsapDv:0000087  normal             PATO:0000461</span></span>
+<span><span class="co">#&gt; 4                     HsapDv:0000087  normal             PATO:0000461</span></span>
+<span><span class="co">#&gt; 5                     HsapDv:0000087  normal             PATO:0000461</span></span>
+<span><span class="co">#&gt; 6                     HsapDv:0000087  normal             PATO:0000461</span></span>
+<span><span class="co">#&gt; 7                     HsapDv:0000087  normal             PATO:0000461</span></span>
+<span><span class="co">#&gt; 8                     HsapDv:0000087  normal             PATO:0000461</span></span>
+<span><span class="co">#&gt; 9                     HsapDv:0000087  normal             PATO:0000461</span></span>
+<span><span class="co">#&gt;                       donor_id is_primary_data self_reported_ethnicity</span></span>
+<span><span class="co">#&gt; 1 Pagella_GSE161267_GSM4904134            TRUE                 unknown</span></span>
+<span><span class="co">#&gt; 2 Pagella_GSE161267_GSM4904134            TRUE                 unknown</span></span>
+<span><span class="co">#&gt; 3 Pagella_GSE161267_GSM4904134            TRUE                 unknown</span></span>
+<span><span class="co">#&gt; 4 Pagella_GSE161267_GSM4904134            TRUE                 unknown</span></span>
+<span><span class="co">#&gt; 5 Pagella_GSE161267_GSM4904134            TRUE                 unknown</span></span>
+<span><span class="co">#&gt; 6 Pagella_GSE161267_GSM4904134            TRUE                 unknown</span></span>
+<span><span class="co">#&gt; 7 Pagella_GSE161267_GSM4904134            TRUE                 unknown</span></span>
+<span><span class="co">#&gt; 8 Pagella_GSE161267_GSM4904134            TRUE                 unknown</span></span>
+<span><span class="co">#&gt; 9 Pagella_GSE161267_GSM4904134            TRUE                 unknown</span></span>
+<span><span class="co">#&gt;   self_reported_ethnicity_ontology_term_id     sex sex_ontology_term_id suspension_type</span></span>
+<span><span class="co">#&gt; 1                                  unknown unknown              unknown            cell</span></span>
+<span><span class="co">#&gt; 2                                  unknown unknown              unknown            cell</span></span>
+<span><span class="co">#&gt; 3                                  unknown unknown              unknown            cell</span></span>
+<span><span class="co">#&gt; 4                                  unknown unknown              unknown            cell</span></span>
+<span><span class="co">#&gt; 5                                  unknown unknown              unknown            cell</span></span>
+<span><span class="co">#&gt; 6                                  unknown unknown              unknown            cell</span></span>
+<span><span class="co">#&gt; 7                                  unknown unknown              unknown            cell</span></span>
+<span><span class="co">#&gt; 8                                  unknown unknown              unknown            cell</span></span>
+<span><span class="co">#&gt; 9                                  unknown unknown              unknown            cell</span></span>
+<span><span class="co">#&gt;    tissue tissue_ontology_term_id tissue_general tissue_general_ontology_term_id</span></span>
+<span><span class="co">#&gt; 1 gingiva          UBERON:0001828         mucosa                  UBERON:0000344</span></span>
+<span><span class="co">#&gt; 2 gingiva          UBERON:0001828         mucosa                  UBERON:0000344</span></span>
+<span><span class="co">#&gt; 3 gingiva          UBERON:0001828         mucosa                  UBERON:0000344</span></span>
+<span><span class="co">#&gt; 4 gingiva          UBERON:0001828         mucosa                  UBERON:0000344</span></span>
+<span><span class="co">#&gt; 5 gingiva          UBERON:0001828         mucosa                  UBERON:0000344</span></span>
+<span><span class="co">#&gt; 6 gingiva          UBERON:0001828         mucosa                  UBERON:0000344</span></span>
+<span><span class="co">#&gt; 7 gingiva          UBERON:0001828         mucosa                  UBERON:0000344</span></span>
+<span><span class="co">#&gt; 8 gingiva          UBERON:0001828         mucosa                  UBERON:0000344</span></span>
+<span><span class="co">#&gt; 9 gingiva          UBERON:0001828         mucosa                  UBERON:0000344</span></span>
+<span><span class="co">#&gt;   raw_sum  nnz raw_mean_nnz raw_variance_nnz n_measured_vars</span></span>
+<span><span class="co">#&gt; 1     547  329     1.662614        14.559604           31602</span></span>
+<span><span class="co">#&gt; 2     982  563     1.744227         5.315247           31602</span></span>
+<span><span class="co">#&gt; 3   12467 3809     3.273038       109.305683           31602</span></span>
+<span><span class="co">#&gt; 4    1053  566     1.860424         7.430042           31602</span></span>
+<span><span class="co">#&gt; 5     548  363     1.509642         2.410818           31602</span></span>
+<span><span class="co">#&gt; 6     678  429     1.580420        11.379616           31602</span></span>
+<span><span class="co">#&gt; 7     848  524     1.618321         9.437216           31602</span></span>
+<span><span class="co">#&gt; 8     935  608     1.537829         4.868418           31602</span></span>
+<span><span class="co">#&gt; 9     735  485     1.515464         6.213087           31602</span></span>
+<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 3301779 rows ]</span></span></code></pre></div>
 <p>You can use both <code>column_names</code> and <code>value_filter</code> to perform specific queries. For example let’s fetch the <code>disease</code> column for the <code>cell_type</code> <code>"B cell"</code> in the <code>tissue_general</code> <code>"lung"</code>.</p>
 <div class="sourceCode" id="cb5"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">cell_metadata_b_cell</span> <span class="op">&lt;-</span> <span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_data"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"homo_sapiens"</span><span class="op">)</span><span class="op">$</span><span class="va">obs</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span></span>
@@ -306,7 +291,8 @@ <h2 id="querying-gene-metadata-var">Querying gene metadata (var)<a class="anchor
 <p>Let’s take a look at the metadata available for column selection and row filtering.</p>
 <div class="sourceCode" id="cb6"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_data"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"homo_sapiens"</span><span class="op">)</span><span class="op">$</span><span class="va">ms</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"RNA"</span><span class="op">)</span><span class="op">$</span><span class="va">var</span><span class="op">$</span><span class="fu">colnames</span><span class="op">(</span><span class="op">)</span></span>
-<span><span class="co">#&gt; [1] "soma_joinid"    "feature_id"     "feature_name"   "feature_length"</span></span></code></pre></div>
+<span><span class="co">#&gt; [1] "soma_joinid"    "feature_id"     "feature_name"   "feature_length" "nnz"           </span></span>
+<span><span class="co">#&gt; [6] "n_measured_obs"</span></span></code></pre></div>
 <p>With the exception of soma_joinid these columns are defined in the <a href="https://cellxgene-census.readthedocs.io/en/latest/cellxgene_census_docsite_schema.html" class="external-link">Census schema</a>. Similarly to the cell metadata, we can use the same operations to learn and fetch gene metadata.</p>
 <p>For example, to get the <code>feature_name</code> and <code>feature_length</code> of the genes <code>"ENSG00000161798"</code> and <code>"ENSG00000188229"</code> we can do the following.</p>
 <div class="sourceCode" id="cb7"><pre class="downlit sourceCode r">
@@ -357,25 +343,25 @@ <h2 id="querying-expression-data-as-seurat">Querying expression data as <code>Se
 <span><span class="co">#&gt;  2 layers present: counts, data</span></span></code></pre></div>
 <div class="sourceCode" id="cb9"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="va">seurat_obj</span><span class="op">[[</span><span class="op">]</span><span class="op">]</span><span class="op">)</span></span>
-<span><span class="co">#&gt;                orig.ident nCount_RNA nFeature_RNA cell_type tissue_general  disease</span></span>
-<span><span class="co">#&gt; cell5946018 SeuratProject          0            0    B cell           lung COVID-19</span></span>
-<span><span class="co">#&gt; cell5948526 SeuratProject          1            1    B cell           lung COVID-19</span></span>
-<span><span class="co">#&gt; cell5949180 SeuratProject          0            0    B cell           lung COVID-19</span></span>
-<span><span class="co">#&gt; cell5949686 SeuratProject          0            0    B cell           lung COVID-19</span></span>
-<span><span class="co">#&gt; cell5950730 SeuratProject          0            0    B cell           lung COVID-19</span></span>
-<span><span class="co">#&gt; cell5952197 SeuratProject          0            0    B cell           lung COVID-19</span></span>
-<span><span class="co">#&gt;                 sex</span></span>
-<span><span class="co">#&gt; cell5946018    male</span></span>
-<span><span class="co">#&gt; cell5948526 unknown</span></span>
-<span><span class="co">#&gt; cell5949180    male</span></span>
-<span><span class="co">#&gt; cell5949686 unknown</span></span>
-<span><span class="co">#&gt; cell5950730    male</span></span>
-<span><span class="co">#&gt; cell5952197 unknown</span></span></code></pre></div>
+<span><span class="co">#&gt;                 orig.ident nCount_RNA nFeature_RNA cell_type tissue_general  disease</span></span>
+<span><span class="co">#&gt; cell13391229 SeuratProject          0            0    B cell           lung COVID-19</span></span>
+<span><span class="co">#&gt; cell13393737 SeuratProject          1            1    B cell           lung COVID-19</span></span>
+<span><span class="co">#&gt; cell13394391 SeuratProject          0            0    B cell           lung COVID-19</span></span>
+<span><span class="co">#&gt; cell13394897 SeuratProject          0            0    B cell           lung COVID-19</span></span>
+<span><span class="co">#&gt; cell13395941 SeuratProject          0            0    B cell           lung COVID-19</span></span>
+<span><span class="co">#&gt; cell13397408 SeuratProject          0            0    B cell           lung COVID-19</span></span>
+<span><span class="co">#&gt;                  sex</span></span>
+<span><span class="co">#&gt; cell13391229    male</span></span>
+<span><span class="co">#&gt; cell13393737 unknown</span></span>
+<span><span class="co">#&gt; cell13394391    male</span></span>
+<span><span class="co">#&gt; cell13394897 unknown</span></span>
+<span><span class="co">#&gt; cell13395941    male</span></span>
+<span><span class="co">#&gt; cell13397408 unknown</span></span></code></pre></div>
 <div class="sourceCode" id="cb10"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="va">seurat_obj</span><span class="op">$</span><span class="va">RNA</span><span class="op">[[</span><span class="op">]</span><span class="op">]</span><span class="op">)</span></span>
-<span><span class="co">#&gt;                 feature_name feature_length</span></span>
-<span><span class="co">#&gt; ENSG00000161798         AQP5           1884</span></span>
-<span><span class="co">#&gt; ENSG00000188229       TUBB4B           2037</span></span></code></pre></div>
+<span><span class="co">#&gt;                 feature_name feature_length      nnz n_measured_obs</span></span>
+<span><span class="co">#&gt; ENSG00000161798         AQP5           1884  1029069       58250439</span></span>
+<span><span class="co">#&gt; ENSG00000188229       TUBB4B           2037 21416107       62655002</span></span></code></pre></div>
 <p>For a full description refer to <code><a href="../reference/get_seurat.html">?cellxgene.census::get_seurat</a></code>.</p>
 </div>
 <div class="section level2">
@@ -398,8 +384,8 @@ <h2 id="querying-expression-data-as-singlecellexperiment">Querying expression da
 <span><span class="co">#&gt; metadata(0):</span></span>
 <span><span class="co">#&gt; assays(1): counts</span></span>
 <span><span class="co">#&gt; rownames(2): ENSG00000161798 ENSG00000188229</span></span>
-<span><span class="co">#&gt; rowData names(2): feature_name feature_length</span></span>
-<span><span class="co">#&gt; colnames(2729): obs5946018 obs5948526 ... obs48038140 obs48038164</span></span>
+<span><span class="co">#&gt; rowData names(4): feature_name feature_length nnz n_measured_obs</span></span>
+<span><span class="co">#&gt; colnames(2729): obs13391229 obs13393737 ... obs54635684 obs54635708</span></span>
 <span><span class="co">#&gt; colData names(4): cell_type tissue_general disease sex</span></span>
 <span><span class="co">#&gt; reducedDimNames(0):</span></span>
 <span><span class="co">#&gt; mainExpName: RNA</span></span>
@@ -407,21 +393,21 @@ <h2 id="querying-expression-data-as-singlecellexperiment">Querying expression da
 <div class="sourceCode" id="cb12"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/pkg/SummarizedExperiment/man/SummarizedExperiment-class.html" class="external-link">colData</a></span><span class="op">(</span><span class="va">sce_obj</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="co">#&gt; DataFrame with 6 rows and 4 columns</span></span>
-<span><span class="co">#&gt;              cell_type tissue_general     disease         sex</span></span>
-<span><span class="co">#&gt;            &lt;character&gt;    &lt;character&gt; &lt;character&gt; &lt;character&gt;</span></span>
-<span><span class="co">#&gt; obs5946018      B cell           lung    COVID-19        male</span></span>
-<span><span class="co">#&gt; obs5948526      B cell           lung    COVID-19     unknown</span></span>
-<span><span class="co">#&gt; obs5949180      B cell           lung    COVID-19        male</span></span>
-<span><span class="co">#&gt; obs5949686      B cell           lung    COVID-19     unknown</span></span>
-<span><span class="co">#&gt; obs5950730      B cell           lung    COVID-19        male</span></span>
-<span><span class="co">#&gt; obs5952197      B cell           lung    COVID-19     unknown</span></span></code></pre></div>
+<span><span class="co">#&gt;               cell_type tissue_general     disease         sex</span></span>
+<span><span class="co">#&gt;             &lt;character&gt;    &lt;character&gt; &lt;character&gt; &lt;character&gt;</span></span>
+<span><span class="co">#&gt; obs13391229      B cell           lung    COVID-19        male</span></span>
+<span><span class="co">#&gt; obs13393737      B cell           lung    COVID-19     unknown</span></span>
+<span><span class="co">#&gt; obs13394391      B cell           lung    COVID-19        male</span></span>
+<span><span class="co">#&gt; obs13394897      B cell           lung    COVID-19     unknown</span></span>
+<span><span class="co">#&gt; obs13395941      B cell           lung    COVID-19        male</span></span>
+<span><span class="co">#&gt; obs13397408      B cell           lung    COVID-19     unknown</span></span></code></pre></div>
 <div class="sourceCode" id="cb13"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/pkg/SummarizedExperiment/man/SummarizedExperiment-class.html" class="external-link">rowData</a></span><span class="op">(</span><span class="va">sce_obj</span><span class="op">)</span><span class="op">)</span></span>
-<span><span class="co">#&gt; DataFrame with 2 rows and 2 columns</span></span>
-<span><span class="co">#&gt;                 feature_name feature_length</span></span>
-<span><span class="co">#&gt;                  &lt;character&gt;      &lt;integer&gt;</span></span>
-<span><span class="co">#&gt; ENSG00000161798         AQP5           1884</span></span>
-<span><span class="co">#&gt; ENSG00000188229       TUBB4B           2037</span></span></code></pre></div>
+<span><span class="co">#&gt; DataFrame with 2 rows and 4 columns</span></span>
+<span><span class="co">#&gt;                 feature_name feature_length       nnz n_measured_obs</span></span>
+<span><span class="co">#&gt;                  &lt;character&gt;      &lt;integer&gt; &lt;integer&gt;      &lt;integer&gt;</span></span>
+<span><span class="co">#&gt; ENSG00000161798         AQP5           1884   1029069       58250439</span></span>
+<span><span class="co">#&gt; ENSG00000188229       TUBB4B           2037  21416107       62655002</span></span></code></pre></div>
 <p>For a full description refer to <code><a href="../reference/get_single_cell_experiment.html">?cellxgene.census::get_single_cell_experiment</a></code>.</p>
 <div class="section level3">
 <h3 id="close-the-census">Close the census<a class="anchor" aria-label="anchor" href="#close-the-census"></a>
diff --git a/r/articles/comp_bio_census_info.html b/r/articles/comp_bio_census_info.html
index 4e383c536..3bacf0d70 100644
--- a/r/articles/comp_bio_census_info.html
+++ b/r/articles/comp_bio_census_info.html
@@ -61,6 +61,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -185,7 +186,12 @@ <h2 id="cell-metadata">Cell metadata<a class="anchor" aria-label="anchor" href="
 <span><span class="co">#&gt; [18] "tissue"                                  </span></span>
 <span><span class="co">#&gt; [19] "tissue_ontology_term_id"                 </span></span>
 <span><span class="co">#&gt; [20] "tissue_general"                          </span></span>
-<span><span class="co">#&gt; [21] "tissue_general_ontology_term_id"</span></span></code></pre></div>
+<span><span class="co">#&gt; [21] "tissue_general_ontology_term_id"         </span></span>
+<span><span class="co">#&gt; [22] "raw_sum"                                 </span></span>
+<span><span class="co">#&gt; [23] "nnz"                                     </span></span>
+<span><span class="co">#&gt; [24] "raw_mean_nnz"                            </span></span>
+<span><span class="co">#&gt; [25] "raw_variance_nnz"                        </span></span>
+<span><span class="co">#&gt; [26] "n_measured_vars"</span></span></code></pre></div>
 <p>All of these variables are defined in the <a href="https://github.com/chanzuckerberg/single-cell-curation/blob/main/schema/3.0.0/schema.md#obs-cell-metadata" class="external-link">CELLxGENE dataset schema</a> except for the following:</p>
 <ul>
 <li>
@@ -203,7 +209,8 @@ <h2 id="gene-metadata">Gene metadata<a class="anchor" aria-label="anchor" href="
 <p>These are the variables you can use for querying the Census in case there are specific genes you are interested in.</p>
 <div class="sourceCode" id="cb3"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_data"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"homo_sapiens"</span><span class="op">)</span><span class="op">$</span><span class="va">ms</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"RNA"</span><span class="op">)</span><span class="op">$</span><span class="va">var</span><span class="op">$</span><span class="fu">colnames</span><span class="op">(</span><span class="op">)</span></span>
-<span><span class="co">#&gt; [1] "soma_joinid"    "feature_id"     "feature_name"   "feature_length"</span></span></code></pre></div>
+<span><span class="co">#&gt; [1] "soma_joinid"    "feature_id"     "feature_name"   "feature_length" "nnz"           </span></span>
+<span><span class="co">#&gt; [6] "n_measured_obs"</span></span></code></pre></div>
 <p>All of these variables are defined in the CELLxGENE dataset schema except for the following:</p>
 <ul>
 <li>
@@ -219,13 +226,13 @@ <h2 id="census-summary-content-tables">Census summary content tables<a class="an
 <div class="sourceCode" id="cb4"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_info"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"summary"</span><span class="op">)</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span><span class="op">)</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="co">#&gt;   soma_joinid                      label      value</span></span>
-<span><span class="co">#&gt; 1           0      census_schema_version      1.0.0</span></span>
-<span><span class="co">#&gt; 2           1          census_build_date 2023-07-25</span></span>
-<span><span class="co">#&gt; 3           2     dataset_schema_version      3.0.0</span></span>
-<span><span class="co">#&gt; 4           3           total_cell_count   61656118</span></span>
-<span><span class="co">#&gt; 5           4          unique_cell_count   37447773</span></span>
-<span><span class="co">#&gt; 6           5 number_donors_homo_sapiens      13035</span></span>
-<span><span class="co">#&gt; 7           6 number_donors_mus_musculus       1417</span></span></code></pre></div>
+<span><span class="co">#&gt; 1           0      census_schema_version      1.2.0</span></span>
+<span><span class="co">#&gt; 2           1          census_build_date 2023-10-23</span></span>
+<span><span class="co">#&gt; 3           2     dataset_schema_version      3.1.0</span></span>
+<span><span class="co">#&gt; 4           3           total_cell_count   68683222</span></span>
+<span><span class="co">#&gt; 5           4          unique_cell_count   40356133</span></span>
+<span><span class="co">#&gt; 6           5 number_donors_homo_sapiens      15588</span></span>
+<span><span class="co">#&gt; 7           6 number_donors_mus_musculus       1990</span></span></code></pre></div>
 <p>Of special interest are the label-value combinations for:</p>
 <ul>
 <li>
@@ -244,19 +251,19 @@ <h3 id="cell-counts-by-cell-metadata">Cell counts by cell metadata<a class="anch
 <code class="sourceCode R"><span><span class="va">census_counts</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_info"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"summary_cell_counts"</span><span class="op">)</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span><span class="op">)</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="va">census_counts</span><span class="op">)</span></span>
 <span><span class="co">#&gt;   soma_joinid     organism category ontology_term_id unique_cell_count total_cell_count</span></span>
-<span><span class="co">#&gt; 1           0 Homo sapiens      all               na          33364242         56400873</span></span>
+<span><span class="co">#&gt; 1           0 Homo sapiens      all               na          36227903         62998417</span></span>
 <span><span class="co">#&gt; 2           1 Homo sapiens    assay      EFO:0008722            264166           279635</span></span>
 <span><span class="co">#&gt; 3           2 Homo sapiens    assay      EFO:0008780             25652            51304</span></span>
-<span><span class="co">#&gt; 4           3 Homo sapiens    assay      EFO:0008919             89477           206754</span></span>
-<span><span class="co">#&gt; 5           4 Homo sapiens    assay      EFO:0008931             78750           188248</span></span>
-<span><span class="co">#&gt; 6           5 Homo sapiens    assay      EFO:0008953              4693             9386</span></span>
+<span><span class="co">#&gt; 4           3 Homo sapiens    assay      EFO:0008796             54753            54753</span></span>
+<span><span class="co">#&gt; 5           4 Homo sapiens    assay      EFO:0008919             89477           206754</span></span>
+<span><span class="co">#&gt; 6           5 Homo sapiens    assay      EFO:0008931             78750           188248</span></span>
 <span><span class="co">#&gt;        label</span></span>
 <span><span class="co">#&gt; 1         na</span></span>
 <span><span class="co">#&gt; 2   Drop-seq</span></span>
 <span><span class="co">#&gt; 3     inDrop</span></span>
-<span><span class="co">#&gt; 4   Seq-Well</span></span>
-<span><span class="co">#&gt; 5 Smart-seq2</span></span>
-<span><span class="co">#&gt; 6   STRT-seq</span></span></code></pre></div>
+<span><span class="co">#&gt; 4   MARS-seq</span></span>
+<span><span class="co">#&gt; 5   Seq-Well</span></span>
+<span><span class="co">#&gt; 6 Smart-seq2</span></span></code></pre></div>
 <p>For each combination of <code>organism</code> and values for each <code>category</code> of cell metadata you can take a look at <code>total_cell_count</code> and <code>unique_cell_count</code> for the cell counts of that combination.</p>
 <p>The values for each <code>category</code> are specified in <code>ontology_term_id</code> and <code>label</code>, which are the value’s IDs and labels, respectively.</p>
 <div class="section level4">
@@ -268,14 +275,14 @@ <h4 id="example-cell-metadata-included-in-the-summary-counts-table">Example: cel
 <span><span class="co">#&gt;                          </span></span>
 <span><span class="co">#&gt;                           Homo sapiens Mus musculus</span></span>
 <span><span class="co">#&gt;   all                                1            1</span></span>
-<span><span class="co">#&gt;   assay                             19            9</span></span>
-<span><span class="co">#&gt;   cell_type                        613          248</span></span>
-<span><span class="co">#&gt;   disease                           64            5</span></span>
-<span><span class="co">#&gt;   self_reported_ethnicity           26            1</span></span>
+<span><span class="co">#&gt;   assay                             20           10</span></span>
+<span><span class="co">#&gt;   cell_type                        631          248</span></span>
+<span><span class="co">#&gt;   disease                           72            5</span></span>
+<span><span class="co">#&gt;   self_reported_ethnicity           30            1</span></span>
 <span><span class="co">#&gt;   sex                                3            3</span></span>
 <span><span class="co">#&gt;   suspension_type                    1            1</span></span>
-<span><span class="co">#&gt;   tissue                           220           66</span></span>
-<span><span class="co">#&gt;   tissue_general                    54           27</span></span></code></pre></div>
+<span><span class="co">#&gt;   tissue                           230           74</span></span>
+<span><span class="co">#&gt;   tissue_general                    53           27</span></span></code></pre></div>
 </div>
 <div class="section level4">
 <h4 id="example-cell-counts-for-each-sequencing-assay-in-human-data">Example: cell counts for each sequencing assay in human data<a class="anchor" aria-label="anchor" href="#example-cell-counts-for-each-sequencing-assay-in-human-data"></a>
@@ -292,11 +299,11 @@ <h4 id="example-number-of-microglial-cells-in-the-census">Example: number of mic
 <div class="sourceCode" id="cb8"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">census_counts</span><span class="op">[</span><span class="va">census_counts</span><span class="op">$</span><span class="va">label</span> <span class="op">==</span> <span class="st">"microglial cell"</span>, <span class="op">]</span></span>
 <span><span class="co">#&gt;      soma_joinid     organism  category ontology_term_id unique_cell_count</span></span>
-<span><span class="co">#&gt; 70            69 Homo sapiens cell_type       CL:0000129            268114</span></span>
-<span><span class="co">#&gt; 1039        1038 Mus musculus cell_type       CL:0000129             48998</span></span>
+<span><span class="co">#&gt; 72            71 Homo sapiens cell_type       CL:0000129            359243</span></span>
+<span><span class="co">#&gt; 1080        1079 Mus musculus cell_type       CL:0000129             48998</span></span>
 <span><span class="co">#&gt;      total_cell_count           label</span></span>
-<span><span class="co">#&gt; 70             370771 microglial cell</span></span>
-<span><span class="co">#&gt; 1039            62617 microglial cell</span></span></code></pre></div>
+<span><span class="co">#&gt; 72             544977 microglial cell</span></span>
+<span><span class="co">#&gt; 1080            75885 microglial cell</span></span></code></pre></div>
 </div>
 </div>
 </div>
@@ -319,136 +326,136 @@ <h3 id="example-all-cell-types-available-in-human">Example: all cell types avail
 <div class="sourceCode" id="cb9"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">obs_df</span> <span class="op">&lt;-</span>   <span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_data"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"homo_sapiens"</span><span class="op">)</span><span class="op">$</span><span class="va">obs</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span>column_names <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"cell_type"</span>, <span class="st">"is_primary_data"</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">obs_df</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span><span class="op">)</span></span>
-<span><span class="co">#&gt;                         cell_type is_primary_data</span></span>
-<span><span class="co">#&gt; 1        syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 2   placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 3        syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 4        syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 5        extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 6   placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 7        syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 8        extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 9   placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 10       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 11       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 12       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 13  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 14  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 15       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 16       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 17       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 18       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 19       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 20       extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 21       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 22       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 23  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 24       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 25       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 26       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 27       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 28       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 29       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 30       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 31  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 32         trophoblast giant cell           FALSE</span></span>
-<span><span class="co">#&gt; 33       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 34  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 35       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 36       extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 37  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 38  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 39       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 40       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 41       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 42       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 43       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 44  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 45  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 46       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 47  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 48       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 49       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 50       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 51       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 52       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 53       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 54       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 55  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 56  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 57  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 58       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 59       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 60       extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 61  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 62       extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 63       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 64       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 65       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 66  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 67       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 68  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 69       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 70       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 71       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 72       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 73  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 74  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 75  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 76  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 77       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 78       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 79       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 80  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 81       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 82       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 83       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 84  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 85       extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 86       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 87       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 88  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 89  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 90       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 91       extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 92  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 93       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 94       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 95       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 96       extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 97       syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 98  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 99  placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 100      extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 101 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 102      syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 103      syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 104      extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 105 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 106 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 107 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 108 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 109      syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 110 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 111 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 112      extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 113      extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 114      syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 115 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 116      extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 117 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 118 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 119      syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 120      syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 121      syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 122      syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 123      syncytiotrophoblast cell           FALSE</span></span>
-<span><span class="co">#&gt; 124 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 125 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 126 placental villous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 127      extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt; 128      extravillous trophoblast           FALSE</span></span>
-<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 56400745 rows ]</span></span></code></pre></div>
+<span><span class="co">#&gt;                            cell_type is_primary_data</span></span>
+<span><span class="co">#&gt; 1                    oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 2     oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 3   astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 4   astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 5   astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 6     oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 7   astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 8                    microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 9   astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 10  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 11  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 12  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 13  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 14  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 15  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 16    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 17                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 18  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 19  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 20  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 21  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 22  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 23    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 24  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 25  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 26    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 27                   microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 28                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 29  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 30  cerebral cortex endothelial cell           FALSE</span></span>
+<span><span class="co">#&gt; 31                   microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 32                   microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 33                   microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 34                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 35                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 36                   microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 37                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 38                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 39  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 40                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 41  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 42                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 43    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 44                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 45  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 46    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 47                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 48    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 49  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 50  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 51  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 52                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 53                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 54                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 55  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 56  cerebral cortex endothelial cell           FALSE</span></span>
+<span><span class="co">#&gt; 57                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 58                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 59                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 60                   microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 61                   microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 62    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 63    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 64                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 65    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 66                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 67  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 68                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 69    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 70                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 71  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 72  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 73  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 74    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 75  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 76    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 77                   microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 78                   microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 79    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 80                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 81                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 82  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 83                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 84  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 85  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 86                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 87  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 88                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 89    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 90    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 91  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 92  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 93  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 94                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 95  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 96  astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 97                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 98                   oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 99    oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 100                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 101                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 102                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 103 astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 104   oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 105                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 106   oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 107                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 108                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 109                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 110                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 111   oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 112                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 113                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 114 astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 115                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 116 astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 117                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 118                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 119                  oligodendrocyte           FALSE</span></span>
+<span><span class="co">#&gt; 120 astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 121 astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 122   oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt; 123                  microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 124 astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 125 astrocyte of the cerebral cortex           FALSE</span></span>
+<span><span class="co">#&gt; 126                  microglial cell           FALSE</span></span>
+<span><span class="co">#&gt; 127 cerebral cortex endothelial cell           FALSE</span></span>
+<span><span class="co">#&gt; 128   oligodendrocyte precursor cell           FALSE</span></span>
+<span><span class="co">#&gt;  [ reached 'max' / getOption("max.print") -- omitted 62998289 rows ]</span></span></code></pre></div>
 <p>The number of rows is the total number of cells for humans. Now, if you wish to get the cell counts per cell type we can work with this data frame.</p>
 <p>In addition, we will only focus on cells that are marked with <code>is_primary_data=TRUE</code> as this ensures we de-duplicate cells that appear more than once in CELLxGENE Discover.</p>
 <div class="sourceCode" id="cb10"><pre class="downlit sourceCode r">
@@ -459,27 +466,37 @@ <h3 id="example-all-cell-types-available-in-human">Example: all cell types avail
 <span></span>
 <span><span class="va">obs_df</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">obs_df</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/nrow.html" class="external-link">nrow</a></span><span class="op">(</span><span class="va">obs_df</span><span class="op">)</span></span>
-<span><span class="co">#&gt; [1] 33364242</span></span></code></pre></div>
+<span><span class="co">#&gt; [1] 36227903</span></span></code></pre></div>
 <p>This is the number of unique cells. Now let’s look at the counts per cell type:</p>
 <div class="sourceCode" id="cb11"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">human_cell_type_counts</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/table.html" class="external-link">table</a></span><span class="op">(</span><span class="va">obs_df</span><span class="op">$</span><span class="va">cell_type</span><span class="op">)</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/sort.html" class="external-link">sort</a></span><span class="op">(</span><span class="va">human_cell_type_counts</span>, decreasing <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span><span class="op">[</span><span class="fl">1</span><span class="op">:</span><span class="fl">10</span><span class="op">]</span></span>
 <span><span class="co">#&gt; </span></span>
-<span><span class="co">#&gt;                          neuron            glutamatergic neuron </span></span>
-<span><span class="co">#&gt;                         2673669                         1541605 </span></span>
-<span><span class="co">#&gt; CD4-positive, alpha-beta T cell CD8-positive, alpha-beta T cell </span></span>
-<span><span class="co">#&gt;                         1258976                         1235987 </span></span>
-<span><span class="co">#&gt;              classical monocyte                          B cell </span></span>
-<span><span class="co">#&gt;                         1030996                          908651 </span></span>
-<span><span class="co">#&gt;                     native cell             natural killer cell </span></span>
-<span><span class="co">#&gt;                          889262                          768755 </span></span>
-<span><span class="co">#&gt;                      macrophage                 oligodendrocyte </span></span>
-<span><span class="co">#&gt;                          721687                          710242</span></span></code></pre></div>
+<span><span class="co">#&gt;                                                             neuron </span></span>
+<span><span class="co">#&gt;                                                            2815336 </span></span>
+<span><span class="co">#&gt;                                               glutamatergic neuron </span></span>
+<span><span class="co">#&gt;                                                            1563446 </span></span>
+<span><span class="co">#&gt;                                    CD4-positive, alpha-beta T cell </span></span>
+<span><span class="co">#&gt;                                                            1243885 </span></span>
+<span><span class="co">#&gt;                                    CD8-positive, alpha-beta T cell </span></span>
+<span><span class="co">#&gt;                                                            1197715 </span></span>
+<span><span class="co">#&gt; L2/3-6 intratelencephalic projecting glutamatergic cortical neuron </span></span>
+<span><span class="co">#&gt;                                                            1123360 </span></span>
+<span><span class="co">#&gt;                                                    oligodendrocyte </span></span>
+<span><span class="co">#&gt;                                                            1063874 </span></span>
+<span><span class="co">#&gt;                                                 classical monocyte </span></span>
+<span><span class="co">#&gt;                                                            1030996 </span></span>
+<span><span class="co">#&gt;                                                        native cell </span></span>
+<span><span class="co">#&gt;                                                            1011949 </span></span>
+<span><span class="co">#&gt;                                                             B cell </span></span>
+<span><span class="co">#&gt;                                                             934060 </span></span>
+<span><span class="co">#&gt;                                                natural killer cell </span></span>
+<span><span class="co">#&gt;                                                             770637</span></span></code></pre></div>
 <p>This shows you that the most abundant cell types are “glutamatergic neuron”, “CD8-positive, alpha-beta T cell”, and “CD4-positive, alpha-beta T cell”.</p>
 <p>Now let’s take a look at the number of unique cell types:</p>
 <div class="sourceCode" id="cb12"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/base/length.html" class="external-link">length</a></span><span class="op">(</span><span class="va">human_cell_type_counts</span><span class="op">)</span></span>
-<span><span class="co">#&gt; [1] 599</span></span></code></pre></div>
+<span><span class="co">#&gt; [1] 610</span></span></code></pre></div>
 <p>That is the total number of different cell types for human.</p>
 <p>All the information in this example can be quickly obtained from the summary table at <code>census$get("census-info")$get("summary_cell_counts")</code>.</p>
 <p>The examples below are more complex and can only be achieved by accessing the cell metadata.</p>
@@ -525,74 +542,78 @@ <h3 id="example-diseased-t-cells-in-human-tissues">Example: diseased T cells in
 <span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/table.html" class="external-link">table</a></span><span class="op">(</span><span class="va">obs_t_cells_df</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="co">#&gt;                                        tissue_general</span></span>
-<span><span class="co">#&gt; disease                                 adipose tissue adrenal gland  blood blood clot</span></span>
-<span><span class="co">#&gt;   B-cell non-Hodgkin lymphoma                        0             0  62499          0</span></span>
-<span><span class="co">#&gt;   breast cancer                                      0             0      0          0</span></span>
-<span><span class="co">#&gt;   chronic obstructive pulmonary disease              0             0      0          0</span></span>
-<span><span class="co">#&gt;   chronic rhinitis                                   0             0      0          0</span></span>
-<span><span class="co">#&gt;   clear cell renal carcinoma                         0             0   6548          0</span></span>
-<span><span class="co">#&gt;   COVID-19                                           0             0 819428          0</span></span>
-<span><span class="co">#&gt;   Crohn disease                                      0             0      0          0</span></span>
-<span><span class="co">#&gt;   cystic fibrosis                                    0             0      0          0</span></span>
-<span><span class="co">#&gt;   Down syndrome                                      0             0      0          0</span></span>
-<span><span class="co">#&gt;   follicular lymphoma                                0             0      0          0</span></span>
-<span><span class="co">#&gt;   influenza                                          0             0   8871          0</span></span>
-<span><span class="co">#&gt;   interstitial lung disease                          0             0      0          0</span></span>
-<span><span class="co">#&gt;   kidney benign neoplasm                             0             0     20          0</span></span>
-<span><span class="co">#&gt;   kidney oncocytoma                                  0             0     16          0</span></span>
-<span><span class="co">#&gt;   lung adenocarcinoma                                0           205      0          0</span></span>
+<span><span class="co">#&gt; disease                                 adrenal gland  blood bone marrow  brain breast</span></span>
+<span><span class="co">#&gt;   breast cancer                                     0      0           0      0   1850</span></span>
+<span><span class="co">#&gt;   chronic obstructive pulmonary disease             0      0           0      0      0</span></span>
+<span><span class="co">#&gt;   chronic rhinitis                                  0      0           0      0      0</span></span>
+<span><span class="co">#&gt;   clear cell renal carcinoma                        0   6548           0      0      0</span></span>
+<span><span class="co">#&gt;   COVID-19                                          0 819428           0      0      0</span></span>
+<span><span class="co">#&gt;   Crohn disease                                     0      0           0      0      0</span></span>
+<span><span class="co">#&gt;   cystic fibrosis                                   0      0           0      0      0</span></span>
+<span><span class="co">#&gt;   Down syndrome                                     0      0         181      0      0</span></span>
+<span><span class="co">#&gt;   follicular lymphoma                               0      0           0      0      0</span></span>
+<span><span class="co">#&gt;   influenza                                         0   8871           0      0      0</span></span>
+<span><span class="co">#&gt;   interstitial lung disease                         0      0           0      0      0</span></span>
+<span><span class="co">#&gt;   kidney benign neoplasm                            0      0           0      0      0</span></span>
+<span><span class="co">#&gt;   kidney oncocytoma                                 0      0           0      0      0</span></span>
+<span><span class="co">#&gt;   lung adenocarcinoma                             205      0           0   3274      0</span></span>
+<span><span class="co">#&gt;   lung large cell carcinoma                         0      0           0      0      0</span></span>
+<span><span class="co">#&gt;   lymphangioleiomyomatosis                          0      0           0      0      0</span></span>
 <span><span class="co">#&gt;                                        tissue_general</span></span>
-<span><span class="co">#&gt; disease                                 bone marrow  brain breast  colon kidney  liver</span></span>
-<span><span class="co">#&gt;   B-cell non-Hodgkin lymphoma                     0      0      0      0      0      0</span></span>
-<span><span class="co">#&gt;   breast cancer                                   0      0   1850      0      0      0</span></span>
-<span><span class="co">#&gt;   chronic obstructive pulmonary disease           0      0      0      0      0      0</span></span>
-<span><span class="co">#&gt;   chronic rhinitis                                0      0      0      0      0      0</span></span>
-<span><span class="co">#&gt;   clear cell renal carcinoma                      0      0      0      0  20540      0</span></span>
-<span><span class="co">#&gt;   COVID-19                                        0      0      0      0      0      0</span></span>
-<span><span class="co">#&gt;   Crohn disease                                   0      0      0  17490      0      0</span></span>
-<span><span class="co">#&gt;   cystic fibrosis                                 0      0      0      0      0      0</span></span>
-<span><span class="co">#&gt;   Down syndrome                                 181      0      0      0      0      0</span></span>
-<span><span class="co">#&gt;   follicular lymphoma                             0      0      0      0      0      0</span></span>
-<span><span class="co">#&gt;   influenza                                       0      0      0      0      0      0</span></span>
-<span><span class="co">#&gt;   interstitial lung disease                       0      0      0      0      0      0</span></span>
-<span><span class="co">#&gt;   kidney benign neoplasm                          0      0      0      0     10      0</span></span>
-<span><span class="co">#&gt;   kidney oncocytoma                               0      0      0      0   2408      0</span></span>
-<span><span class="co">#&gt;   lung adenocarcinoma                             0   3274      0      0      0    507</span></span>
+<span><span class="co">#&gt; disease                                  colon kidney  liver   lung lymph node   nose</span></span>
+<span><span class="co">#&gt;   breast cancer                              0      0      0      0          0      0</span></span>
+<span><span class="co">#&gt;   chronic obstructive pulmonary disease      0      0      0   9382          0      0</span></span>
+<span><span class="co">#&gt;   chronic rhinitis                           0      0      0      0          0    909</span></span>
+<span><span class="co">#&gt;   clear cell renal carcinoma                 0  20540      0      0         36      0</span></span>
+<span><span class="co">#&gt;   COVID-19                                   0      0      0  30578          0     13</span></span>
+<span><span class="co">#&gt;   Crohn disease                          17490      0      0      0          0      0</span></span>
+<span><span class="co">#&gt;   cystic fibrosis                            0      0      0      7          0      0</span></span>
+<span><span class="co">#&gt;   Down syndrome                              0      0      0      0          0      0</span></span>
+<span><span class="co">#&gt;   follicular lymphoma                        0      0      0      0       1089      0</span></span>
+<span><span class="co">#&gt;   influenza                                  0      0      0      0          0      0</span></span>
+<span><span class="co">#&gt;   interstitial lung disease                  0      0      0   1803          0      0</span></span>
+<span><span class="co">#&gt;   kidney benign neoplasm                     0     10      0      0          0      0</span></span>
+<span><span class="co">#&gt;   kidney oncocytoma                          0   2303      0      0          0      0</span></span>
+<span><span class="co">#&gt;   lung adenocarcinoma                        0      0    507 215013      24969      0</span></span>
+<span><span class="co">#&gt;   lung large cell carcinoma                  0      0      0   5922          0      0</span></span>
+<span><span class="co">#&gt;   lymphangioleiomyomatosis                   0      0      0    513          0      0</span></span>
 <span><span class="co">#&gt;                                        tissue_general</span></span>
-<span><span class="co">#&gt; disease                                   lung lymph node   nose pleural fluid</span></span>
-<span><span class="co">#&gt;   B-cell non-Hodgkin lymphoma                0          0      0             0</span></span>
-<span><span class="co">#&gt;   breast cancer                              0          0      0             0</span></span>
-<span><span class="co">#&gt;   chronic obstructive pulmonary disease   9382          0      0             0</span></span>
-<span><span class="co">#&gt;   chronic rhinitis                           0          0    909             0</span></span>
-<span><span class="co">#&gt;   clear cell renal carcinoma                 0         36      0             0</span></span>
-<span><span class="co">#&gt;   COVID-19                               30578          0     13             0</span></span>
-<span><span class="co">#&gt;   Crohn disease                              0          0      0             0</span></span>
-<span><span class="co">#&gt;   cystic fibrosis                            7          0      0             0</span></span>
-<span><span class="co">#&gt;   Down syndrome                              0          0      0             0</span></span>
-<span><span class="co">#&gt;   follicular lymphoma                        0       1089      0             0</span></span>
-<span><span class="co">#&gt;   influenza                                  0          0      0             0</span></span>
-<span><span class="co">#&gt;   interstitial lung disease               1803          0      0             0</span></span>
-<span><span class="co">#&gt;   kidney benign neoplasm                     0          0      0             0</span></span>
-<span><span class="co">#&gt;   kidney oncocytoma                          0          0      0             0</span></span>
-<span><span class="co">#&gt;   lung adenocarcinoma                   215013      24969      0         11558</span></span>
+<span><span class="co">#&gt; disease                                 pleural fluid respiratory system saliva</span></span>
+<span><span class="co">#&gt;   breast cancer                                     0                  0      0</span></span>
+<span><span class="co">#&gt;   chronic obstructive pulmonary disease             0                  0      0</span></span>
+<span><span class="co">#&gt;   chronic rhinitis                                  0                  0      0</span></span>
+<span><span class="co">#&gt;   clear cell renal carcinoma                        0                  0      0</span></span>
+<span><span class="co">#&gt;   COVID-19                                          0                  4     41</span></span>
+<span><span class="co">#&gt;   Crohn disease                                     0                  0      0</span></span>
+<span><span class="co">#&gt;   cystic fibrosis                                   0                  0      0</span></span>
+<span><span class="co">#&gt;   Down syndrome                                     0                  0      0</span></span>
+<span><span class="co">#&gt;   follicular lymphoma                               0                  0      0</span></span>
+<span><span class="co">#&gt;   influenza                                         0                  0      0</span></span>
+<span><span class="co">#&gt;   interstitial lung disease                         0                  0      0</span></span>
+<span><span class="co">#&gt;   kidney benign neoplasm                            0                  0      0</span></span>
+<span><span class="co">#&gt;   kidney oncocytoma                                 0                  0      0</span></span>
+<span><span class="co">#&gt;   lung adenocarcinoma                           11558                  0      0</span></span>
+<span><span class="co">#&gt;   lung large cell carcinoma                         0                  0      0</span></span>
+<span><span class="co">#&gt;   lymphangioleiomyomatosis                          0                  0      0</span></span>
 <span><span class="co">#&gt;                                        tissue_general</span></span>
-<span><span class="co">#&gt; disease                                 respiratory system saliva small intestine</span></span>
-<span><span class="co">#&gt;   B-cell non-Hodgkin lymphoma                            0      0               0</span></span>
-<span><span class="co">#&gt;   breast cancer                                          0      0               0</span></span>
-<span><span class="co">#&gt;   chronic obstructive pulmonary disease                  0      0               0</span></span>
-<span><span class="co">#&gt;   chronic rhinitis                                       0      0               0</span></span>
-<span><span class="co">#&gt;   clear cell renal carcinoma                             0      0               0</span></span>
-<span><span class="co">#&gt;   COVID-19                                               4     41               0</span></span>
-<span><span class="co">#&gt;   Crohn disease                                          0      0           52029</span></span>
-<span><span class="co">#&gt;   cystic fibrosis                                        0      0               0</span></span>
-<span><span class="co">#&gt;   Down syndrome                                          0      0               0</span></span>
-<span><span class="co">#&gt;   follicular lymphoma                                    0      0               0</span></span>
-<span><span class="co">#&gt;   influenza                                              0      0               0</span></span>
-<span><span class="co">#&gt;   interstitial lung disease                              0      0               0</span></span>
-<span><span class="co">#&gt;   kidney benign neoplasm                                 0      0               0</span></span>
-<span><span class="co">#&gt;   kidney oncocytoma                                      0      0               0</span></span>
-<span><span class="co">#&gt;   lung adenocarcinoma                                    0      0               0</span></span>
-<span><span class="co">#&gt;  [ reached getOption("max.print") -- omitted 10 rows ]</span></span></code></pre></div>
+<span><span class="co">#&gt; disease                                 small intestine vasculature</span></span>
+<span><span class="co">#&gt;   breast cancer                                       0           0</span></span>
+<span><span class="co">#&gt;   chronic obstructive pulmonary disease               0           0</span></span>
+<span><span class="co">#&gt;   chronic rhinitis                                    0           0</span></span>
+<span><span class="co">#&gt;   clear cell renal carcinoma                          0           0</span></span>
+<span><span class="co">#&gt;   COVID-19                                            0           0</span></span>
+<span><span class="co">#&gt;   Crohn disease                                   52029           0</span></span>
+<span><span class="co">#&gt;   cystic fibrosis                                     0           0</span></span>
+<span><span class="co">#&gt;   Down syndrome                                       0           0</span></span>
+<span><span class="co">#&gt;   follicular lymphoma                                 0           0</span></span>
+<span><span class="co">#&gt;   influenza                                           0           0</span></span>
+<span><span class="co">#&gt;   interstitial lung disease                           0           0</span></span>
+<span><span class="co">#&gt;   kidney benign neoplasm                              0           0</span></span>
+<span><span class="co">#&gt;   kidney oncocytoma                                   0           0</span></span>
+<span><span class="co">#&gt;   lung adenocarcinoma                                 0           0</span></span>
+<span><span class="co">#&gt;   lung large cell carcinoma                           0           0</span></span>
+<span><span class="co">#&gt;   lymphangioleiomyomatosis                            0           0</span></span>
+<span><span class="co">#&gt;  [ reached getOption("max.print") -- omitted 8 rows ]</span></span></code></pre></div>
 <p>These are the cell counts annotated with the indicated disease across human tissues for “CD8-positive, alpha-beta T cell” or “CD4-positive, alpha-beta T cell”.</p>
 </div>
 </div>
diff --git a/r/articles/comp_bio_data_integration.html b/r/articles/comp_bio_data_integration.html
index 506c9aee6..73a0e2829 100644
--- a/r/articles/comp_bio_data_integration.html
+++ b/r/articles/comp_bio_data_integration.html
@@ -61,6 +61,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -136,17 +137,20 @@ <h2 id="finding-and-fetching-data-from-mouse-liver-10x-genomics-and-smart-seq2">
 <span><span class="co"># Print rows with liver data</span></span>
 <span><span class="va">census_datasets</span><span class="op">[</span><span class="fu"><a href="https://rdrr.io/r/base/grep.html" class="external-link">grep</a></span><span class="op">(</span><span class="st">"Liver"</span>, <span class="va">census_datasets</span><span class="op">$</span><span class="va">dataset_title</span><span class="op">)</span>, <span class="op">]</span></span>
 <span><span class="co">#&gt;    soma_joinid                        collection_id    collection_name</span></span>
-<span><span class="co">#&gt; 14         525 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis</span></span>
-<span><span class="co">#&gt; 35         547 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis</span></span>
+<span><span class="co">#&gt; 15         583 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis</span></span>
+<span><span class="co">#&gt; 36         605 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis</span></span>
 <span><span class="co">#&gt;               collection_doi                           dataset_id</span></span>
-<span><span class="co">#&gt; 14 10.1038/s41586-020-2496-1 4546e757-34d0-4d17-be06-538318925fcd</span></span>
-<span><span class="co">#&gt; 35 10.1038/s41586-020-2496-1 6202a243-b713-4e12-9ced-c387f8483dea</span></span>
+<span><span class="co">#&gt; 15 10.1038/s41586-020-2496-1 4546e757-34d0-4d17-be06-538318925fcd</span></span>
+<span><span class="co">#&gt; 36 10.1038/s41586-020-2496-1 6202a243-b713-4e12-9ced-c387f8483dea</span></span>
+<span><span class="co">#&gt;                      dataset_version_id</span></span>
+<span><span class="co">#&gt; 15 0a851e26-a629-4e59-9b52-9b4d1ce4440b</span></span>
+<span><span class="co">#&gt; 36 70f4f091-86a9-44e3-a92a-54cee98cc223</span></span>
 <span><span class="co">#&gt;                                                                                        dataset_title</span></span>
-<span><span class="co">#&gt; 14 Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - Smart-seq2</span></span>
-<span><span class="co">#&gt; 35        Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - 10x</span></span>
+<span><span class="co">#&gt; 15 Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - Smart-seq2</span></span>
+<span><span class="co">#&gt; 36        Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - 10x</span></span>
 <span><span class="co">#&gt;                            dataset_h5ad_path dataset_total_cell_count</span></span>
-<span><span class="co">#&gt; 14 4546e757-34d0-4d17-be06-538318925fcd.h5ad                     2859</span></span>
-<span><span class="co">#&gt; 35 6202a243-b713-4e12-9ced-c387f8483dea.h5ad                     7294</span></span></code></pre></div>
+<span><span class="co">#&gt; 15 4546e757-34d0-4d17-be06-538318925fcd.h5ad                     2859</span></span>
+<span><span class="co">#&gt; 36 6202a243-b713-4e12-9ced-c387f8483dea.h5ad                     7294</span></span></code></pre></div>
 <p>Now we can use the values from <code>dataset_id</code> to query and load a Seurat object with all the cells from those datasets.</p>
 <div class="sourceCode" id="cb4"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">tabula_muris_liver_ids</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">"4546e757-34d0-4d17-be06-538318925fcd"</span>, <span class="st">"6202a243-b713-4e12-9ced-c387f8483dea"</span><span class="op">)</span></span>
@@ -193,7 +197,7 @@ <h3 id="inspecting-data-prior-to-integration">Inspecting data prior to integrati
 <span><span class="va">seurat_obj</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/FindVariableFeatures.html" class="external-link">FindVariableFeatures</a></span><span class="op">(</span><span class="va">seurat_obj</span>, selection.method <span class="op">=</span> <span class="st">"vst"</span>, nfeatures <span class="op">=</span> <span class="fl">2000</span><span class="op">)</span></span></code></pre></div>
 <p>And now perform PCA and UMAP</p>
 <div class="sourceCode" id="cb10"><pre class="downlit sourceCode r">
-<code class="sourceCode R"><span><span class="va">seurat_obj</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/RunPCA.html" class="external-link">RunPCA</a></span><span class="op">(</span><span class="va">seurat_obj</span>, features <span class="op">=</span> <span class="fu"><a href="https://mojaveazure.github.io/seurat-object/reference/VariableFeatures.html" class="external-link">VariableFeatures</a></span><span class="op">(</span>object <span class="op">=</span> <span class="va">seurat_obj</span><span class="op">)</span><span class="op">)</span></span>
+<code class="sourceCode R"><span><span class="va">seurat_obj</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/RunPCA.html" class="external-link">RunPCA</a></span><span class="op">(</span><span class="va">seurat_obj</span>, features <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/pkg/SeuratObject/man/VariableFeatures.html" class="external-link">VariableFeatures</a></span><span class="op">(</span>object <span class="op">=</span> <span class="va">seurat_obj</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="va">seurat_obj</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/RunUMAP.html" class="external-link">RunUMAP</a></span><span class="op">(</span><span class="va">seurat_obj</span>, dims <span class="op">=</span> <span class="fl">1</span><span class="op">:</span><span class="fl">30</span><span class="op">)</span></span></code></pre></div>
 <div class="sourceCode" id="cb11"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="co"># By assay</span></span>
@@ -238,7 +242,7 @@ <h4 id="integration-across-datasets-using-dataset_id">Integration across dataset
 <span><span class="va">seurat_obj.combined</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/IntegrateData.html" class="external-link">IntegrateData</a></span><span class="op">(</span>anchorset <span class="op">=</span> <span class="va">seurat_obj.anchors</span>, normalization.method <span class="op">=</span> <span class="st">"SCT"</span><span class="op">)</span></span></code></pre></div>
 <p>Let’s inspect the results by doing normalization and then UMAP visulization.</p>
 <div class="sourceCode" id="cb15"><pre class="downlit sourceCode r">
-<code class="sourceCode R"><span><span class="fu"><a href="https://mojaveazure.github.io/seurat-object/reference/DefaultAssay.html" class="external-link">DefaultAssay</a></span><span class="op">(</span><span class="va">seurat_obj.combined</span><span class="op">)</span> <span class="op">&lt;-</span> <span class="st">"integrated"</span></span>
+<code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/pkg/SeuratObject/man/DefaultAssay.html" class="external-link">DefaultAssay</a></span><span class="op">(</span><span class="va">seurat_obj.combined</span><span class="op">)</span> <span class="op">&lt;-</span> <span class="st">"integrated"</span></span>
 <span></span>
 <span><span class="co"># Run the standard workflow for visualization and clustering</span></span>
 <span><span class="va">seurat_obj.combined</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/ScaleData.html" class="external-link">ScaleData</a></span><span class="op">(</span><span class="va">seurat_obj.combined</span>, verbose <span class="op">=</span> <span class="cn">FALSE</span><span class="op">)</span></span>
@@ -283,9 +287,9 @@ <h4 id="integration-across-datasets-using-dataset_id-and-controlling-for-batch-u
 <span><span class="co">#&gt; Merging objects</span></span>
 <span><span class="co">#&gt; Finding neighborhoods</span></span>
 <span><span class="co">#&gt; Finding anchors</span></span>
-<span><span class="co">#&gt;  Found 7136 anchors</span></span>
+<span><span class="co">#&gt;  Found 7161 anchors</span></span>
 <span><span class="co">#&gt; Filtering anchors</span></span>
-<span><span class="co">#&gt;  Retained 5048 anchors</span></span>
+<span><span class="co">#&gt;  Retained 4990 anchors</span></span>
 <span><span class="va">seurat_obj.combined</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/IntegrateData.html" class="external-link">IntegrateData</a></span><span class="op">(</span>anchorset <span class="op">=</span> <span class="va">seurat_obj.anchors</span>, normalization.method <span class="op">=</span> <span class="st">"SCT"</span><span class="op">)</span></span>
 <span><span class="co">#&gt; [1] 1</span></span>
 <span><span class="co">#&gt; Warning: Different cells and/or features from existing assay SCT</span></span>
@@ -301,25 +305,25 @@ <h4 id="integration-across-datasets-using-dataset_id-and-controlling-for-batch-u
 <span><span class="co">#&gt; Warning: Different cells and/or features from existing assay SCT</span></span></code></pre></div>
 <p>And inspect the new results by UMAP.</p>
 <div class="sourceCode" id="cb20"><pre class="downlit sourceCode r">
-<code class="sourceCode R"><span><span class="fu"><a href="https://mojaveazure.github.io/seurat-object/reference/DefaultAssay.html" class="external-link">DefaultAssay</a></span><span class="op">(</span><span class="va">seurat_obj.combined</span><span class="op">)</span> <span class="op">&lt;-</span> <span class="st">"integrated"</span></span>
+<code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/pkg/SeuratObject/man/DefaultAssay.html" class="external-link">DefaultAssay</a></span><span class="op">(</span><span class="va">seurat_obj.combined</span><span class="op">)</span> <span class="op">&lt;-</span> <span class="st">"integrated"</span></span>
 <span></span>
 <span><span class="co"># Run the standard workflow for visualization and clustering</span></span>
 <span><span class="va">seurat_obj.combined</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/RunPCA.html" class="external-link">RunPCA</a></span><span class="op">(</span><span class="va">seurat_obj.combined</span>, npcs <span class="op">=</span> <span class="fl">30</span>, verbose <span class="op">=</span> <span class="cn">FALSE</span><span class="op">)</span></span>
 <span><span class="va">seurat_obj.combined</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/RunUMAP.html" class="external-link">RunUMAP</a></span><span class="op">(</span><span class="va">seurat_obj.combined</span>, reduction <span class="op">=</span> <span class="st">"pca"</span>, dims <span class="op">=</span> <span class="fl">1</span><span class="op">:</span><span class="fl">30</span><span class="op">)</span></span>
-<span><span class="co">#&gt; 10:16:53 UMAP embedding parameters a = 0.9922 b = 1.112</span></span>
-<span><span class="co">#&gt; 10:16:53 Read 10153 rows and found 30 numeric columns</span></span>
-<span><span class="co">#&gt; 10:16:53 Using Annoy for neighbor search, n_neighbors = 30</span></span>
-<span><span class="co">#&gt; 10:16:53 Building Annoy index with metric = cosine, n_trees = 50</span></span>
+<span><span class="co">#&gt; 14:49:10 UMAP embedding parameters a = 0.9922 b = 1.112</span></span>
+<span><span class="co">#&gt; 14:49:10 Read 10153 rows and found 30 numeric columns</span></span>
+<span><span class="co">#&gt; 14:49:10 Using Annoy for neighbor search, n_neighbors = 30</span></span>
+<span><span class="co">#&gt; 14:49:10 Building Annoy index with metric = cosine, n_trees = 50</span></span>
 <span><span class="co">#&gt; 0%   10   20   30   40   50   60   70   80   90   100%</span></span>
 <span><span class="co">#&gt; [----|----|----|----|----|----|----|----|----|----|</span></span>
 <span><span class="co">#&gt; **************************************************|</span></span>
-<span><span class="co">#&gt; 10:16:55 Writing NN index file to temp file /tmp/RtmpzP59ex/file8ed3ae2ddbc</span></span>
-<span><span class="co">#&gt; 10:16:55 Searching Annoy index using 1 thread, search_k = 3000</span></span>
-<span><span class="co">#&gt; 10:16:58 Annoy recall = 100%</span></span>
-<span><span class="co">#&gt; 10:16:59 Commencing smooth kNN distance calibration using 1 thread with target n_neighbors = 30</span></span>
-<span><span class="co">#&gt; 10:16:59 Initializing from normalized Laplacian + noise (using RSpectra)</span></span>
-<span><span class="co">#&gt; 10:17:00 Commencing optimization for 200 epochs, with 409718 positive edges</span></span>
-<span><span class="co">#&gt; 10:17:04 Optimization finished</span></span></code></pre></div>
+<span><span class="co">#&gt; 14:49:12 Writing NN index file to temp file /tmp/RtmpRa88jI/file926122f23120</span></span>
+<span><span class="co">#&gt; 14:49:12 Searching Annoy index using 1 thread, search_k = 3000</span></span>
+<span><span class="co">#&gt; 14:49:16 Annoy recall = 100%</span></span>
+<span><span class="co">#&gt; 14:49:16 Commencing smooth kNN distance calibration using 1 thread with target n_neighbors = 30</span></span>
+<span><span class="co">#&gt; 14:49:17 Initializing from normalized Laplacian + noise (using RSpectra)</span></span>
+<span><span class="co">#&gt; 14:49:17 Commencing optimization for 200 epochs, with 409958 positive edges</span></span>
+<span><span class="co">#&gt; 14:49:21 Optimization finished</span></span></code></pre></div>
 <p>Plot the UMAP.</p>
 <div class="sourceCode" id="cb21"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="co"># By assay</span></span>
diff --git a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-12-1.png b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-12-1.png
index 21f4e8e35..eb3edd712 100644
Binary files a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-12-1.png and b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-12-1.png differ
diff --git a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-13-1.png b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-13-1.png
index a119ef287..6cd19d1c2 100644
Binary files a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-13-1.png and b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-13-1.png differ
diff --git a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-17-1.png b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-17-1.png
index af790e53b..f61613490 100644
Binary files a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-17-1.png and b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-17-1.png differ
diff --git a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-18-1.png b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-18-1.png
index 5e43455e5..c53282d06 100644
Binary files a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-18-1.png and b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-18-1.png differ
diff --git a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-22-1.png b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-22-1.png
index ef04f6b1f..71bf2f0e0 100644
Binary files a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-22-1.png and b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-22-1.png differ
diff --git a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-23-1.png b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-23-1.png
index c6c933c91..73c81af1c 100644
Binary files a/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-23-1.png and b/r/articles/comp_bio_data_integration_files/figure-html/unnamed-chunk-23-1.png differ
diff --git a/r/articles/comp_bio_normalizing_full_gene_sequencing.html b/r/articles/comp_bio_normalizing_full_gene_sequencing.html
index 9339d254e..0d6c7ed39 100644
--- a/r/articles/comp_bio_normalizing_full_gene_sequencing.html
+++ b/r/articles/comp_bio_normalizing_full_gene_sequencing.html
@@ -61,6 +61,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -137,9 +138,11 @@ <h2 id="fetching-full-length-example-sequencing-data-smart-seq">Fetching full-le
 <span><span class="op">)</span></span>
 <span><span class="va">liver_dataset</span></span>
 <span><span class="co">#&gt;   soma_joinid                        collection_id    collection_name</span></span>
-<span><span class="co">#&gt; 1         525 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis</span></span>
+<span><span class="co">#&gt; 1         583 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis</span></span>
 <span><span class="co">#&gt;              collection_doi                           dataset_id</span></span>
 <span><span class="co">#&gt; 1 10.1038/s41586-020-2496-1 4546e757-34d0-4d17-be06-538318925fcd</span></span>
+<span><span class="co">#&gt;                     dataset_version_id</span></span>
+<span><span class="co">#&gt; 1 0a851e26-a629-4e59-9b52-9b4d1ce4440b</span></span>
 <span><span class="co">#&gt;                                                                                       dataset_title</span></span>
 <span><span class="co">#&gt; 1 Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - Smart-seq2</span></span>
 <span><span class="co">#&gt;                           dataset_h5ad_path dataset_total_cell_count</span></span>
@@ -168,8 +171,8 @@ <h2 id="normalizing-expression-to-account-for-gene-length">Normalizing expressio
 <div class="sourceCode" id="cb5"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">liver_seurat</span></span>
 <span><span class="co">#&gt; An object of class Seurat </span></span>
-<span><span class="co">#&gt; 52392 features across 2859 samples within 1 assay </span></span>
-<span><span class="co">#&gt; Active assay: RNA (52392 features, 0 variable features)</span></span>
+<span><span class="co">#&gt; 52417 features across 2859 samples within 1 assay </span></span>
+<span><span class="co">#&gt; Active assay: RNA (52417 features, 0 variable features)</span></span>
 <span><span class="co">#&gt;  2 layers present: counts, data</span></span></code></pre></div>
 <p>Let’s get the genes measured in this dataset.</p>
 <div class="sourceCode" id="cb6"><pre class="downlit sourceCode r">
@@ -187,13 +190,13 @@ <h2 id="normalizing-expression-to-account-for-gene-length">Normalizing expressio
 <p>We can see that out of all genes in the Census <strong>17,992</strong> were measured in this dataset.</p>
 <p>Now let’s normalize these genes by gene length. We can easily do this because the Census has gene lengths included in the gene metadata under <code>feature_length</code>.</p>
 <div class="sourceCode" id="cb7"><pre class="downlit sourceCode r">
-<code class="sourceCode R"><span><span class="fu"><a href="https://mojaveazure.github.io/seurat-object/reference/AssayData.html" class="external-link">GetAssayData</a></span><span class="op">(</span><span class="va">liver_seurat</span><span class="op">[</span><span class="fl">1</span><span class="op">:</span><span class="fl">5</span>, <span class="fl">1</span><span class="op">:</span><span class="fl">5</span><span class="op">]</span>, slot <span class="op">=</span> <span class="st">"data"</span><span class="op">)</span></span>
+<code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/pkg/SeuratObject/man/AssayData.html" class="external-link">GetAssayData</a></span><span class="op">(</span><span class="va">liver_seurat</span><span class="op">[</span><span class="fl">1</span><span class="op">:</span><span class="fl">5</span>, <span class="fl">1</span><span class="op">:</span><span class="fl">5</span><span class="op">]</span>, slot <span class="op">=</span> <span class="st">"data"</span><span class="op">)</span></span>
 <span><span class="co">#&gt; Warning: The `slot` argument of `GetAssayData()` is deprecated as of SeuratObject 5.0.0.</span></span>
 <span><span class="co">#&gt; <span style="color: #00BBBB;">ℹ</span> Please use the `layer` argument instead.</span></span>
 <span><span class="co">#&gt; <span style="color: #555555;">This warning is displayed once every 8 hours.</span></span></span>
 <span><span class="co">#&gt; <span style="color: #555555;">Call `lifecycle::last_lifecycle_warnings()` to see where this warning was generated.</span></span></span>
 <span><span class="co">#&gt; 5 x 5 sparse Matrix of class "dgCMatrix"</span></span>
-<span><span class="co">#&gt;                    cell3530079 cell3530080 cell3530081 cell3530082 cell3530083</span></span>
+<span><span class="co">#&gt;                    cell3959639 cell3959640 cell3959641 cell3959642 cell3959643</span></span>
 <span><span class="co">#&gt; ENSMUSG00000025900           .           .           .           .           .</span></span>
 <span><span class="co">#&gt; ENSMUSG00000025902           .           .           .           .        2250</span></span>
 <span><span class="co">#&gt; ENSMUSG00000033845           .         559        1969           .           .</span></span>
@@ -201,14 +204,14 @@ <h2 id="normalizing-expression-to-account-for-gene-length">Normalizing expressio
 <span><span class="co">#&gt; ENSMUSG00000033813           .           .         828           1          54</span></span></code></pre></div>
 <div class="sourceCode" id="cb8"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">gene_lengths</span> <span class="op">&lt;-</span> <span class="va">liver_seurat</span><span class="op">$</span><span class="va">RNA</span><span class="op">@</span><span class="va">meta.features</span><span class="op">$</span><span class="va">feature_length</span></span>
-<span><span class="va">liver_seurat</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://mojaveazure.github.io/seurat-object/reference/AssayData.html" class="external-link">SetAssayData</a></span><span class="op">(</span></span>
+<span><span class="va">liver_seurat</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/pkg/SeuratObject/man/AssayData.html" class="external-link">SetAssayData</a></span><span class="op">(</span></span>
 <span>  <span class="va">liver_seurat</span>, </span>
-<span>  new.data <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/sweep.html" class="external-link">sweep</a></span><span class="op">(</span><span class="fu"><a href="https://mojaveazure.github.io/seurat-object/reference/AssayData.html" class="external-link">GetAssayData</a></span><span class="op">(</span><span class="va">liver_seurat</span>, slot <span class="op">=</span> <span class="st">"data"</span><span class="op">)</span>, <span class="fl">1</span>, <span class="va">gene_lengths</span>, <span class="st">"/"</span><span class="op">)</span></span>
+<span>  new.data <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/sweep.html" class="external-link">sweep</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/pkg/SeuratObject/man/AssayData.html" class="external-link">GetAssayData</a></span><span class="op">(</span><span class="va">liver_seurat</span>, slot <span class="op">=</span> <span class="st">"data"</span><span class="op">)</span>, <span class="fl">1</span>, <span class="va">gene_lengths</span>, <span class="st">"/"</span><span class="op">)</span></span>
 <span><span class="op">)</span></span></code></pre></div>
 <div class="sourceCode" id="cb9"><pre class="downlit sourceCode r">
-<code class="sourceCode R"><span><span class="fu"><a href="https://mojaveazure.github.io/seurat-object/reference/AssayData.html" class="external-link">GetAssayData</a></span><span class="op">(</span><span class="va">liver_seurat</span><span class="op">[</span><span class="fl">1</span><span class="op">:</span><span class="fl">5</span>, <span class="fl">1</span><span class="op">:</span><span class="fl">5</span><span class="op">]</span>, slot <span class="op">=</span> <span class="st">"data"</span><span class="op">)</span></span>
+<code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/pkg/SeuratObject/man/AssayData.html" class="external-link">GetAssayData</a></span><span class="op">(</span><span class="va">liver_seurat</span><span class="op">[</span><span class="fl">1</span><span class="op">:</span><span class="fl">5</span>, <span class="fl">1</span><span class="op">:</span><span class="fl">5</span><span class="op">]</span>, slot <span class="op">=</span> <span class="st">"data"</span><span class="op">)</span></span>
 <span><span class="co">#&gt; 5 x 5 sparse Matrix of class "dgCMatrix"</span></span>
-<span><span class="co">#&gt;                    cell3530079 cell3530080 cell3530081  cell3530082 cell3530083</span></span>
+<span><span class="co">#&gt;                    cell3959639 cell3959640 cell3959641  cell3959642 cell3959643</span></span>
 <span><span class="co">#&gt; ENSMUSG00000025900           .  .            .         .             .         </span></span>
 <span><span class="co">#&gt; ENSMUSG00000025902           .  .            .         .             0.47150042</span></span>
 <span><span class="co">#&gt; ENSMUSG00000033845           .  0.06586544   0.2320019 .             .         </span></span>
@@ -222,7 +225,7 @@ <h2 id="validation-through-clustering-exploration">Validation through clustering
 <p>Let’s perform some basic clustering analysis to see if cell types cluster as expected using the normalized counts.</p>
 <p>First we do some basic filtering of cells and genes.</p>
 <div class="sourceCode" id="cb10"><pre class="downlit sourceCode r">
-<code class="sourceCode R"><span><span class="va">cells_per_gene</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/colSums.html" class="external-link">rowSums</a></span><span class="op">(</span><span class="fu"><a href="https://mojaveazure.github.io/seurat-object/reference/AssayData.html" class="external-link">GetAssayData</a></span><span class="op">(</span><span class="va">liver_seurat</span>, slot <span class="op">=</span> <span class="st">"counts"</span><span class="op">)</span> <span class="op">&gt;</span> <span class="fl">0</span><span class="op">)</span></span>
+<code class="sourceCode R"><span><span class="va">cells_per_gene</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/colSums.html" class="external-link">rowSums</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/pkg/SeuratObject/man/AssayData.html" class="external-link">GetAssayData</a></span><span class="op">(</span><span class="va">liver_seurat</span>, slot <span class="op">=</span> <span class="st">"counts"</span><span class="op">)</span> <span class="op">&gt;</span> <span class="fl">0</span><span class="op">)</span></span>
 <span><span class="va">genes_per_cell</span> <span class="op">&lt;-</span> <span class="fu">Matrix</span><span class="fu">::</span><span class="fu"><a href="https://rdrr.io/pkg/Matrix/man/colSums.html" class="external-link">colSums</a></span><span class="op">(</span><span class="va">liver_seurat</span><span class="op">$</span><span class="va">RNA</span><span class="op">@</span><span class="va">counts</span> <span class="op">&gt;</span> <span class="fl">0</span><span class="op">)</span></span>
 <span><span class="va">liver_seurat</span> <span class="op">&lt;-</span> <span class="va">liver_seurat</span><span class="op">[</span><span class="va">cells_per_gene</span> <span class="op">&gt;=</span> <span class="fl">5</span>, <span class="va">genes_per_cell</span> <span class="op">&gt;=</span> <span class="fl">500</span><span class="op">]</span></span></code></pre></div>
 <p>Then we normalize to account for sequencing depth and transform data to log scale.</p>
@@ -247,7 +250,7 @@ <h2 id="validation-through-clustering-exploration">Validation through clustering
 <div class="sourceCode" id="cb14"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="va">liver_seurat</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/RunPCA.html" class="external-link">RunPCA</a></span><span class="op">(</span></span>
 <span>  <span class="va">liver_seurat</span>,</span>
-<span>  features <span class="op">=</span> <span class="fu"><a href="https://mojaveazure.github.io/seurat-object/reference/VariableFeatures.html" class="external-link">VariableFeatures</a></span><span class="op">(</span>object <span class="op">=</span> <span class="va">liver_seurat</span><span class="op">)</span></span>
+<span>  features <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/pkg/SeuratObject/man/VariableFeatures.html" class="external-link">VariableFeatures</a></span><span class="op">(</span>object <span class="op">=</span> <span class="va">liver_seurat</span><span class="op">)</span></span>
 <span><span class="op">)</span></span>
 <span><span class="va">liver_seurat</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/FindNeighbors.html" class="external-link">FindNeighbors</a></span><span class="op">(</span><span class="va">liver_seurat</span>, dims <span class="op">=</span> <span class="fl">1</span><span class="op">:</span><span class="fl">40</span><span class="op">)</span></span>
 <span><span class="va">liver_seurat</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://satijalab.org/seurat/reference/RunUMAP.html" class="external-link">RunUMAP</a></span><span class="op">(</span><span class="va">liver_seurat</span>, dims <span class="op">=</span> <span class="fl">1</span><span class="op">:</span><span class="fl">40</span><span class="op">)</span></span>
diff --git a/r/articles/comp_bio_summarize_axis_query.html b/r/articles/comp_bio_summarize_axis_query.html
index ad4bb24fd..e4b246118 100644
--- a/r/articles/comp_bio_summarize_axis_query.html
+++ b/r/articles/comp_bio_summarize_axis_query.html
@@ -61,6 +61,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
diff --git a/r/articles/index.html b/r/articles/index.html
index 8e340b2b5..440491e44 100644
--- a/r/articles/index.html
+++ b/r/articles/index.html
@@ -38,6 +38,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -88,6 +89,8 @@ <h3>API</h3>
       <p class="section-desc"></p>
 
       <dl><dt><a href="census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a></dt>
+        <dd>
+        </dd><dt><a href="census_citation_generation.html">Generating citations for Census slices</a></dt>
         <dd>
         </dd><dt><a href="census_datasets.html">Census Datasets example</a></dt>
         <dd>
diff --git a/r/authors.html b/r/authors.html
index 6f4321c9b..d29e646b7 100644
--- a/r/authors.html
+++ b/r/authors.html
@@ -38,6 +38,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -76,14 +77,14 @@ <h2>Authors</h2>
       <h2 id="citation">Citation</h2>
       <p><small class="dont-index">Source: <a href="https://github.com/chanzuckerberg/cellxgene-census/tree/main/api/r/cellxgene.census/DESCRIPTION" class="external-link"><code>DESCRIPTION</code></a></small></p>
 
-      <p>Chan Zuckerberg Initiative Foundation (2023).
+      <p>Chan Zuckerberg Initiative Foundation (2024).
 <em>cellxgene.census: CZ CELLxGENE Discover Cell Census</em>.
 R package version 1.9.1, <a href="https://github.com/chanzuckerberg/cellxgene-census" class="external-link">https://github.com/chanzuckerberg/cellxgene-census</a>. 
 </p>
       <pre>@Manual{,
   title = {cellxgene.census: CZ CELLxGENE Discover Cell Census},
   author = {{Chan Zuckerberg Initiative Foundation}},
-  year = {2023},
+  year = {2024},
   note = {R package version 1.9.1},
   url = {https://github.com/chanzuckerberg/cellxgene-census},
 }</pre>
diff --git a/r/index.html b/r/index.html
index d90e72f13..d7676cada 100644
--- a/r/index.html
+++ b/r/index.html
@@ -65,6 +65,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
diff --git a/r/pkgdown.yml b/r/pkgdown.yml
index 760d5821e..49945b046 100644
--- a/r/pkgdown.yml
+++ b/r/pkgdown.yml
@@ -3,6 +3,7 @@ pkgdown: 2.0.7
 pkgdown_sha: ~
 articles:
   census_access_maintained_embeddings: census_access_maintained_embeddings.html
+  census_citation_generation: census_citation_generation.html
   census_compute_over_X: census_compute_over_X.html
   census_dataset_presence: census_dataset_presence.html
   census_datasets: census_datasets.html
@@ -11,5 +12,5 @@ articles:
   comp_bio_data_integration: comp_bio_data_integration.html
   comp_bio_normalizing_full_gene_sequencing: comp_bio_normalizing_full_gene_sequencing.html
   comp_bio_summarize_axis_query: comp_bio_summarize_axis_query.html
-last_built: 2023-12-18T17:31Z
+last_built: 2024-01-08T22:03Z
 
diff --git a/r/reference/download_source_h5ad.html b/r/reference/download_source_h5ad.html
index 2fb90fa8a..783a0833b 100644
--- a/r/reference/download_source_h5ad.html
+++ b/r/reference/download_source_h5ad.html
@@ -38,6 +38,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
diff --git a/r/reference/get_census_version_description.html b/r/reference/get_census_version_description.html
index 8cc77f51c..d06f4fdd2 100644
--- a/r/reference/get_census_version_description.html
+++ b/r/reference/get_census_version_description.html
@@ -38,6 +38,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -91,15 +92,15 @@ <h2 id="value">Value<a class="anchor" aria-label="anchor" href="#value"></a></h2
     <h2 id="ref-examples">Examples<a class="anchor" aria-label="anchor" href="#ref-examples"></a></h2>
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="r-in"><span><span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="fu">get_census_version_description</span><span class="op">(</span><span class="st">"stable"</span><span class="op">)</span><span class="op">)</span></span></span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>   release_date release_build</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1                 2023-07-25</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 1                 2023-12-15</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>                                                              soma.uri</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1 s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 1 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>               soma.relative_uri soma.s3_region</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1 /cell-census/2023-07-25/soma/      us-west-2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 1 /cell-census/2023-12-15/soma/      us-west-2</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>                                                              h5ads.uri</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1 s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/h5ads/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 1 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/h5ads/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>               h5ads.relative_uri h5ads.s3_region do_not_delete  lts  alias</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1 /cell-census/2023-07-25/h5ads/       us-west-2          TRUE TRUE stable</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 1 /cell-census/2023-12-15/h5ads/       us-west-2          TRUE TRUE stable</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>   census_version</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 1         stable</span>
 </code></pre></div>
diff --git a/r/reference/get_census_version_directory.html b/r/reference/get_census_version_directory.html
index c7bf2e322..72705876a 100644
--- a/r/reference/get_census_version_directory.html
+++ b/r/reference/get_census_version_directory.html
@@ -38,6 +38,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -86,71 +87,77 @@ <h2 id="value">Value<a class="anchor" aria-label="anchor" href="#value"></a></h2
     <h2 id="ref-examples">Examples<a class="anchor" aria-label="anchor" href="#ref-examples"></a></h2>
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="r-in"><span><span class="fu">get_census_version_directory</span><span class="op">(</span><span class="op">)</span></span></span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>            release_date release_build</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> stable                     2023-07-25</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> latest                     2023-12-11</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> stable                     2023-12-15</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> latest                     2024-01-01</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-05-15                 2023-05-15</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-07-25                 2023-07-25</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-10-23                 2023-10-23</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-13                 2023-11-13</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-20                 2023-11-20</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-27                 2023-11-27</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-11                 2023-12-11</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-15                 2023-12-15</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-18                 2023-12-18</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-21                 2023-12-21</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-25                 2023-12-25</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2024-01-01                 2024-01-01</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>                                                                       soma.uri</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> stable     s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> latest     s3://cellxgene-census-public-us-west-2/cell-census/2023-12-11/soma/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> stable     s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> latest     s3://cellxgene-census-public-us-west-2/cell-census/2024-01-01/soma/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-05-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-05-15/soma/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-07-25 s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-10-23 s3://cellxgene-census-public-us-west-2/cell-census/2023-10-23/soma/</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-13 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-13/soma/</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-20 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-20/soma/</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-27 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-27/soma/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-11 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-11/soma/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-18 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-18/soma/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-21 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-21/soma/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-25 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-25/soma/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2024-01-01 s3://cellxgene-census-public-us-west-2/cell-census/2024-01-01/soma/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>                        soma.relative_uri soma.s3_region</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> stable     /cell-census/2023-07-25/soma/      us-west-2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> latest     /cell-census/2023-12-11/soma/      us-west-2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> stable     /cell-census/2023-12-15/soma/      us-west-2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> latest     /cell-census/2024-01-01/soma/      us-west-2</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-05-15 /cell-census/2023-05-15/soma/      us-west-2</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-07-25 /cell-census/2023-07-25/soma/      us-west-2</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-10-23 /cell-census/2023-10-23/soma/      us-west-2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-13 /cell-census/2023-11-13/soma/      us-west-2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-20 /cell-census/2023-11-20/soma/      us-west-2</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-27 /cell-census/2023-11-27/soma/      us-west-2</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-11 /cell-census/2023-12-11/soma/      us-west-2</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-15 /cell-census/2023-12-15/soma/      us-west-2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-18 /cell-census/2023-12-18/soma/      us-west-2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-21 /cell-census/2023-12-21/soma/      us-west-2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-25 /cell-census/2023-12-25/soma/      us-west-2</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2024-01-01 /cell-census/2024-01-01/soma/      us-west-2</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>                                                                       h5ads.uri</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> stable     s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/h5ads/</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> latest     s3://cellxgene-census-public-us-west-2/cell-census/2023-12-11/h5ads/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> stable     s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/h5ads/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> latest     s3://cellxgene-census-public-us-west-2/cell-census/2024-01-01/h5ads/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-05-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-05-15/h5ads/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-07-25 s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/h5ads/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-10-23 s3://cellxgene-census-public-us-west-2/cell-census/2023-10-23/h5ads/</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-13 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-13/h5ads/</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-20 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-20/h5ads/</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-27 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-27/h5ads/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-11 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-11/h5ads/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/h5ads/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-18 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-18/h5ads/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-21 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-21/h5ads/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-25 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-25/h5ads/</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2024-01-01 s3://cellxgene-census-public-us-west-2/cell-census/2024-01-01/h5ads/</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>                        h5ads.relative_uri h5ads.s3_region do_not_delete   lts</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> stable     /cell-census/2023-07-25/h5ads/       us-west-2          TRUE  TRUE</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> latest     /cell-census/2023-12-11/h5ads/       us-west-2         FALSE    NA</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> stable     /cell-census/2023-12-15/h5ads/       us-west-2          TRUE  TRUE</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> latest     /cell-census/2024-01-01/h5ads/       us-west-2         FALSE    NA</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-05-15 /cell-census/2023-05-15/h5ads/       us-west-2          TRUE  TRUE</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-07-25 /cell-census/2023-07-25/h5ads/       us-west-2          TRUE  TRUE</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-10-23 /cell-census/2023-10-23/h5ads/       us-west-2          TRUE FALSE</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-13 /cell-census/2023-11-13/h5ads/       us-west-2         FALSE    NA</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-20 /cell-census/2023-11-20/h5ads/       us-west-2         FALSE    NA</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-27 /cell-census/2023-11-27/h5ads/       us-west-2         FALSE    NA</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-10-23 /cell-census/2023-10-23/h5ads/       us-west-2         FALSE FALSE</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-11 /cell-census/2023-12-11/h5ads/       us-west-2         FALSE    NA</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-15 /cell-census/2023-12-15/h5ads/       us-west-2          TRUE  TRUE</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-18 /cell-census/2023-12-18/h5ads/       us-west-2         FALSE    NA</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-21 /cell-census/2023-12-21/h5ads/       us-west-2         FALSE    NA</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-25 /cell-census/2023-12-25/h5ads/       us-west-2         FALSE    NA</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2024-01-01 /cell-census/2024-01-01/h5ads/       us-west-2         FALSE    NA</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>             alias</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> stable     stable</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> latest     latest</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-05-15       </span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-07-25       </span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-10-23       </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-13       </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-20       </span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-11-27       </span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-11       </span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-15       </span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-18       </span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-21       </span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2023-12-25       </span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2024-01-01       </span>
 </code></pre></div>
     </div>
   </main><aside class="col-md-3"><nav id="toc"><h2>On this page</h2>
diff --git a/r/reference/get_presence_matrix.html b/r/reference/get_presence_matrix.html
index e2bc76ba6..2b3f0f88d 100644
--- a/r/reference/get_presence_matrix.html
+++ b/r/reference/get_presence_matrix.html
@@ -38,6 +38,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -100,10 +101,10 @@ <h2 id="value">Value<a class="anchor" aria-label="anchor" href="#value"></a></h2
     <div class="section level2">
     <h2 id="ref-examples">Examples<a class="anchor" aria-label="anchor" href="#ref-examples"></a></h2>
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="r-in"><span><span class="va">census</span> <span class="op">&lt;-</span> <span class="fu"><a href="open_soma.html">open_soma</a></span><span class="op">(</span><span class="op">)</span></span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> The stable Census release is currently 2023-07-25. Specify census_version = "2023-07-25" in future calls to open_soma() to ensure data consistency.</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> The stable Census release is currently 2023-12-15. Specify census_version = "2023-12-15" in future calls to open_soma() to ensure data consistency.</span>
 <span class="r-in"><span><span class="fu"><a href="https://rdrr.io/r/base/on.exit.html" class="external-link">on.exit</a></span><span class="op">(</span><span class="va">census</span><span class="op">$</span><span class="fu">close</span><span class="op">(</span><span class="op">)</span>, add <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span></span></span>
 <span class="r-in"><span><span class="fu"><a href="https://rdrr.io/r/base/print.html" class="external-link">print</a></span><span class="op">(</span><span class="fu">get_presence_matrix</span><span class="op">(</span><span class="va">census</span>, <span class="st">"Homo sapiens"</span><span class="op">)</span><span class="op">$</span><span class="fu">dim</span><span class="op">(</span><span class="op">)</span><span class="op">)</span></span></span>
-<span class="r-err co"><span class="r-pr">#&gt;</span> <span class="error">Error in private$check_open_for_read_or_write():</span> Item must be open for read or write. s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/</span>
+<span class="r-err co"><span class="r-pr">#&gt;</span> <span class="error">Error in private$check_open_for_read_or_write():</span> Item must be open for read or write. s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/</span>
 </code></pre></div>
     </div>
   </main><aside class="col-md-3"><nav id="toc"><h2>On this page</h2>
diff --git a/r/reference/get_seurat.html b/r/reference/get_seurat.html
index 6c42a8ebb..9d3436c05 100644
--- a/r/reference/get_seurat.html
+++ b/r/reference/get_seurat.html
@@ -40,6 +40,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
diff --git a/r/reference/get_single_cell_experiment.html b/r/reference/get_single_cell_experiment.html
index 2d11d431b..6875eeb3b 100644
--- a/r/reference/get_single_cell_experiment.html
+++ b/r/reference/get_single_cell_experiment.html
@@ -40,6 +40,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
diff --git a/r/reference/get_source_h5ad_uri.html b/r/reference/get_source_h5ad_uri.html
index 27a3e678c..831a729b5 100644
--- a/r/reference/get_source_h5ad_uri.html
+++ b/r/reference/get_source_h5ad_uri.html
@@ -38,6 +38,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -101,7 +102,7 @@ <h2 id="value">Value<a class="anchor" aria-label="anchor" href="#value"></a></h2
     <h2 id="ref-examples">Examples<a class="anchor" aria-label="anchor" href="#ref-examples"></a></h2>
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="r-in"><span><span class="fu">get_source_h5ad_uri</span><span class="op">(</span><span class="st">"0895c838-e550-48a3-a777-dbcd35d30272"</span><span class="op">)</span></span></span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> $uri</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> [1] "s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/h5ads/0895c838-e550-48a3-a777-dbcd35d30272.h5ad"</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> [1] "s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/h5ads/0895c838-e550-48a3-a777-dbcd35d30272.h5ad"</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> </span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> $s3_region</span>
 <span class="r-out co"><span class="r-pr">#&gt;</span> [1] "us-west-2"</span>
diff --git a/r/reference/index.html b/r/reference/index.html
index 4a65cc083..12c9a0fb1 100644
--- a/r/reference/index.html
+++ b/r/reference/index.html
@@ -38,6 +38,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
diff --git a/r/reference/new_SOMATileDBContext_for_census.html b/r/reference/new_SOMATileDBContext_for_census.html
index c1eadeba0..16d4399b6 100644
--- a/r/reference/new_SOMATileDBContext_for_census.html
+++ b/r/reference/new_SOMATileDBContext_for_census.html
@@ -44,6 +44,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -115,7 +116,7 @@ <h2 id="ref-examples">Examples<a class="anchor" aria-label="anchor" href="#ref-e
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="r-in"><span><span class="va">census_desc</span> <span class="op">&lt;-</span> <span class="fu"><a href="get_census_version_description.html">get_census_version_description</a></span><span class="op">(</span><span class="st">"stable"</span><span class="op">)</span></span></span>
 <span class="r-in"><span><span class="va">ctx</span> <span class="op">&lt;-</span> <span class="fu">new_SOMATileDBContext_for_census</span><span class="op">(</span><span class="va">census_desc</span>, <span class="st">"soma.init_buffer_bytes"</span> <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/paste.html" class="external-link">paste</a></span><span class="op">(</span><span class="fl">4</span> <span class="op">*</span> <span class="fl">1024</span><span class="op">**</span><span class="fl">3</span><span class="op">)</span><span class="op">)</span></span></span>
 <span class="r-in"><span><span class="va">census</span> <span class="op">&lt;-</span> <span class="fu"><a href="open_soma.html">open_soma</a></span><span class="op">(</span><span class="st">"stable"</span>, tiledbsoma_ctx <span class="op">=</span> <span class="va">ctx</span><span class="op">)</span></span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> The stable Census release is currently 2023-07-25. Specify census_version = "2023-07-25" in future calls to open_soma() to ensure data consistency.</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> The stable Census release is currently 2023-12-15. Specify census_version = "2023-12-15" in future calls to open_soma() to ensure data consistency.</span>
 <span class="r-in"><span><span class="va">census</span><span class="op">$</span><span class="fu">close</span><span class="op">(</span><span class="op">)</span></span></span>
 </code></pre></div>
     </div>
diff --git a/r/reference/open_soma.html b/r/reference/open_soma.html
index c91b8087b..1922ec33a 100644
--- a/r/reference/open_soma.html
+++ b/r/reference/open_soma.html
@@ -38,6 +38,7 @@ <h6 class="dropdown-header" data-toc-skip>Explore and analyze the data</h6>
     <div class="dropdown-divider"></div>
     <h6 class="dropdown-header" data-toc-skip>cellxgene.census capabilities</h6>
     <a class="dropdown-item" href="../articles/census_query_extract.html">Querying and fetching the single-cell data and cell/gene metadata</a>
+    <a class="dropdown-item" href="../articles/census_citation_generation.html">Generating citations for Census slices</a>
     <a class="dropdown-item" href="../articles/census_datasets.html">Census Datasets example</a>
     <a class="dropdown-item" href="../articles/census_dataset_presence.html">Genes measured in each cell (dataset presence matrix)</a>
     <a class="dropdown-item" href="../articles/census_compute_over_X.html">Computing on X using online (incremental) algorithms</a>
@@ -114,16 +115,16 @@ <h2 id="value">Value<a class="anchor" aria-label="anchor" href="#value"></a></h2
     <div class="section level2">
     <h2 id="ref-examples">Examples<a class="anchor" aria-label="anchor" href="#ref-examples"></a></h2>
     <div class="sourceCode"><pre class="sourceCode r"><code><span class="r-in"><span><span class="va">census</span> <span class="op">&lt;-</span> <span class="fu">open_soma</span><span class="op">(</span><span class="op">)</span></span></span>
-<span class="r-msg co"><span class="r-pr">#&gt;</span> The stable Census release is currently 2023-07-25. Specify census_version = "2023-07-25" in future calls to open_soma() to ensure data consistency.</span>
+<span class="r-msg co"><span class="r-pr">#&gt;</span> The stable Census release is currently 2023-12-15. Specify census_version = "2023-12-15" in future calls to open_soma() to ensure data consistency.</span>
 <span class="r-in"><span><span class="fu"><a href="https://rdrr.io/r/base/as.data.frame.html" class="external-link">as.data.frame</a></span><span class="op">(</span><span class="va">census</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"census_info"</span><span class="op">)</span><span class="op">$</span><span class="fu">get</span><span class="op">(</span><span class="st">"summary"</span><span class="op">)</span><span class="op">$</span><span class="fu">read</span><span class="op">(</span><span class="op">)</span><span class="op">$</span><span class="fu">concat</span><span class="op">(</span><span class="op">)</span><span class="op">)</span></span></span>
 <span class="r-out co"><span class="r-pr">#&gt;</span>   soma_joinid                      label      value</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 1           0      census_schema_version      1.0.0</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 2           1          census_build_date 2023-07-25</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 3           2     dataset_schema_version      3.0.0</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 4           3           total_cell_count   61656118</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 5           4          unique_cell_count   37447773</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 6           5 number_donors_homo_sapiens      13035</span>
-<span class="r-out co"><span class="r-pr">#&gt;</span> 7           6 number_donors_mus_musculus       1417</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 1           0      census_schema_version      1.2.0</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 2           1          census_build_date 2023-10-23</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 3           2     dataset_schema_version      3.1.0</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 4           3           total_cell_count   68683222</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 5           4          unique_cell_count   40356133</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 6           5 number_donors_homo_sapiens      15588</span>
+<span class="r-out co"><span class="r-pr">#&gt;</span> 7           6 number_donors_mus_musculus       1990</span>
 <span class="r-in"><span><span class="va">census</span><span class="op">$</span><span class="fu">close</span><span class="op">(</span><span class="op">)</span></span></span>
 </code></pre></div>
     </div>
diff --git a/r/search.json b/r/search.json
index 33d6de3ed..df1e3514c 100644
--- a/r/search.json
+++ b/r/search.json
@@ -1 +1 @@
-[{"path":"/LICENSE.html","id":null,"dir":"","previous_headings":"","what":"MIT License","title":"MIT License","text":"Copyright (c) 2023 Chan Zuckerberg Initiative Foundation Permission hereby granted, free charge, person obtaining copy software associated documentation files (“Software”), deal Software without restriction, including without limitation rights use, copy, modify, merge, publish, distribute, sublicense, /sell copies Software, permit persons Software furnished , subject following conditions: copyright notice permission notice shall included copies substantial portions Software. SOFTWARE PROVIDED “”, WITHOUT WARRANTY KIND, EXPRESS IMPLIED, INCLUDING LIMITED WARRANTIES MERCHANTABILITY, FITNESS PARTICULAR PURPOSE NONINFRINGEMENT. EVENT SHALL AUTHORS COPYRIGHT HOLDERS LIABLE CLAIM, DAMAGES LIABILITY, WHETHER ACTION CONTRACT, TORT OTHERWISE, ARISING , CONNECTION SOFTWARE USE DEALINGS SOFTWARE.","code":""},{"path":"/articles/census_access_maintained_embeddings.html","id":"open-census","dir":"Articles","previous_headings":"","what":"Open Census","title":"Access CELLxGENE collaboration embeddings (scVI, Geneformer)","text":"","code":"library(\"cellxgene.census\") census <- open_soma(census_version = \"2023-12-15\")"},{"path":"/articles/census_access_maintained_embeddings.html","id":"load-embeddings-as-seurat-reductions","dir":"Articles","previous_headings":"","what":"Load embeddings as Seurat reductions","title":"Access CELLxGENE collaboration embeddings (scVI, Geneformer)","text":"high-level cellxgene.census::get_seurat() function can query Census load embeddings dimensional reductions Seurat object. ask Seurat object expression data human cells tissue_general equal 'central nervous system', along scVI geneformer embeddings (obsm_layers). embeddings stored dimensional reductions seurat_obj, can take quick look scVI embeddings 2D scatter plot via UMAP, colored Census cell_type annotations.","code":"library(\"Seurat\")  seurat_obj <- get_seurat(   census,    organism = \"homo_sapiens\",   obs_value_filter = \"tissue_general == 'central nervous system'\",   obs_column_names = c(\"cell_type\"),   obsm_layers = c(\"scvi\",\"geneformer\") ) seurat_obj <- RunUMAP(   seurat_obj,    reduction = \"scvi\",   dims=1:ncol(Embeddings(seurat_obj, \"scvi\")) )  DimPlot(seurat_obj, reduction = \"umap\", group.by = \"cell_type\") +   theme(legend.text = element_text(size = 8))"},{"path":"/articles/census_access_maintained_embeddings.html","id":"load-embeddings-as-singlecellexperiment-reductions","dir":"Articles","previous_headings":"","what":"Load embeddings as SingleCellExperiment reductions","title":"Access CELLxGENE collaboration embeddings (scVI, Geneformer)","text":"Similarly, cellxgene.census::get_single_cell_experiment() can query Census store embeddings dimensionality reduction results Bioconductor SingleCellExperiment object. , can view UMAP Geneformer embeddings colored cell_type.","code":"library(\"SingleCellExperiment\") sce_obj <- get_single_cell_experiment(   census,    organism = \"homo_sapiens\",   obs_value_filter = \"tissue_general == 'central nervous system'\",   obs_column_names = c(\"cell_type\"),   obsm_layers = c(\"scvi\",\"geneformer\") ) sce_obj <- scater::runUMAP(sce_obj, dimred = \"geneformer\") scater::plotReducedDim(sce_obj, dimred = \"UMAP\", colour_by = \"cell_type\")"},{"path":"/articles/census_access_maintained_embeddings.html","id":"load-embeddings-as-sparsematrix","dir":"Articles","previous_headings":"","what":"Load embeddings as sparseMatrix","title":"Access CELLxGENE collaboration embeddings (scVI, Geneformer)","text":"Lastly, can use SOMAExperimentAxisQuery lower-level access embeddings’ numerical data. can performant use cases don’t need features Seurat SingleCellExperiment. row embeddings sparseMatrix provides fine-tuned Geneformer model’s 512-dimensional embedding vector cell, cell soma_joinids row names. different arguments, SOMAExperimentAxisQuery$to_sparse_matrix() can also read scVI embeddings expression data. Still lower-level access available SOMAExperimentAxisQuery$read(), streams Arrow tables. methods SOMAExperimentAxisQuery can fetch metadata like cell_type: SOMAExperimentAxisQuery loads ask Census, unlike high-level get_seurat() get_single_cell_experiment() functions, eagerly populate objects based query.","code":"query <- census$get(\"census_data\")$get(\"homo_sapiens\")$axis_query(   \"RNA\", obs_query = tiledbsoma::SOMAAxisQuery$new(value_filter = \"tissue == 'tongue'\") ) embeddings <- query$to_sparse_matrix(\"obsm\", \"geneformer\") str(embeddings) #> Formal class 'dgTMatrix' [package \"Matrix\"] with 6 slots #>   ..@ i       : int [1:190464] 0 0 0 0 0 0 0 0 0 0 ... #>   ..@ j       : int [1:190464] 0 1 2 3 4 5 6 7 8 9 ... #>   ..@ Dim     : int [1:2] 372 512 #>   ..@ Dimnames:List of 2 #>   .. ..$ : chr [1:372] \"51784858\" \"51784859\" \"51784860\" \"51784861\" ... #>   .. ..$ : chr [1:512] \"0\" \"1\" \"2\" \"3\" ... #>   ..@ x       : num [1:190464] 0.1104 -1.2031 1.0078 0.0131 1.2422 ... #>   ..@ factors : list() head(as.data.frame(query$obs(column_names = c(\"soma_joinid\",\"cell_type\"))$concat())) #>   soma_joinid  cell_type #> 1    51784858 basal cell #> 2    51784859 basal cell #> 3    51784860 fibroblast #> 4    51784861 fibroblast #> 5    51784862 basal cell #> 6    51784863 basal cell census$close()"},{"path":"/articles/census_compute_over_X.html","id":"incremental-mean-calculation","dir":"Articles","previous_headings":"","what":"Incremental mean calculation","title":"Computing on X using online (incremental) algorithms","text":"Many statistics, marginal means, easy calculate incrementally. Let’s begin query X$raw sparse matrix unnormalized read counts, return results shards incrementally accumulate read count gene, divide cell count get mean reads per cell gene. First define query - case slice obs axis cells specific tissue & sex value, genes var axis. query$X() method returns iterator results, Arrow Table. table contain sparse X data obs/var coordinates, using standard SOMA names: soma_data - X values (float32) soma_dim_0 - obs coordinate (int64) soma_dim_1 - var coordinate (int64) Important: X matrices joined var/obs axis DataFrames integer join “id” (aka soma_joinid). positionally indexed, given cell gene may soma_joinid value (e.g., large integer). words, given X value, soma_dim_0 corresponds soma_joinid obs dataframe, soma_dim_1 coordinate corresponds soma_joinid var dataframe. convenience, query class includes utility simplify operations query slices. query$indexer indexer used wrap output query$X(), converting soma_joinids positional indexing query results. Positions [0, N), N number results query given axis. Key points: expensive query read results - rather make multiple passes data, read perform multiple computations. default, data census indexed soma_joinid positionally.","code":"library(\"tiledbsoma\") library(\"cellxgene.census\") census <- open_soma()  query <- census$get(\"census_data\")$get(\"mus_musculus\")$axis_query(   measurement_name = \"RNA\",   obs_query = SOMAAxisQuery$new(value_filter = \"tissue=='brain' && sex=='male'\") )  genes_df <- query$var(column_names = c(\"feature_id\", \"feature_name\"))$concat() genes_df <- as.data.frame(genes_df) n_genes <- nrow(genes_df)  # accumulator vector (for each gene) for the total count over all cells in X(\"raw\") raw_sum_by_gene <- numeric(n_genes) names(raw_sum_by_gene) <- genes_df$feature_id  # iterate through in-memory shards of query results tables <- query$X(\"raw\")$tables() while (!tables$read_complete()) {   table_part <- tables$read_next()   # table_part is an Arrow table with the columns mentioned above. The result   # order is not guaranteed!    # table_part$soma_dim_1 is the var/gene soma_joinid. But note that these are   # arbitrary int64 id's, and moreover each table_part may exhibit only a subset   # of the values we'll see over all query results. query$indexer helps us map   # any given soma_dim_1 values onto positions in query$var() (genes_df), that is   # the union of all values we'll see.   gene_indexes <- query$indexer$by_var(table_part$soma_dim_1)$as_vector()   stopifnot(sum(gene_indexes >= n_genes) == 0)   # sum(table_part) group by gene, yielding a numeric vector with the gene_index   # in its names   sum_part <- tapply(as.vector(table_part$soma_data), gene_indexes, sum)   # update the accumulator vector   which_genes <- as.integer(names(sum_part)) + 1  # nb: gene_indexes is zero-based   stopifnot(sum(which_genes > n_genes) == 0)   raw_sum_by_gene[which_genes] <- raw_sum_by_gene[which_genes] + sum_part }  # Divide each sum by cell count to get mean reads per cell (for each gene), # implicitly averaging in all zero entries in X even though they weren't included # in the sparse query results. genes_df$raw_mean <- raw_sum_by_gene / query$n_obs genes_df #>            feature_id  feature_name     raw_mean #> 1  ENSMUSG00000051951          Xkr4 1.283861e+00 #> 2  ENSMUSG00000089699        Gm1992 0.000000e+00 #> 3  ENSMUSG00000102343       Gm37381 0.000000e+00 #> 4  ENSMUSG00000025900           Rp1 2.914160e-01 #> 5  ENSMUSG00000025902         Sox17 6.074154e+01 #> 6  ENSMUSG00000104328       Gm37323 5.701742e-05 #> 7  ENSMUSG00000033845        Mrpl15 3.621738e+01 #> 8  ENSMUSG00000025903        Lypla1 1.827366e+01 #> 9  ENSMUSG00000104217       Gm37988 0.000000e+00 #> 10 ENSMUSG00000033813         Tcea1 3.960339e+01 #> 11 ENSMUSG00000002459         Rgs20 3.212989e+00 #> 12 ENSMUSG00000085623       Gm16041 5.701742e-05 #> 13 ENSMUSG00000033793       Atp6v1h 6.866793e+01 #> 14 ENSMUSG00000025905         Oprk1 4.198763e-01 #> 15 ENSMUSG00000033774        Npbwr1 1.140348e-04 #> 16 ENSMUSG00000025907        Rb1cc1 3.342227e+01 #> 17 ENSMUSG00000090031 4732440D04Rik 1.317102e-02 #> 18 ENSMUSG00000087247        Alkal1 5.701742e-05 #> 19 ENSMUSG00000033740          St18 1.525501e+01 #> 20 ENSMUSG00000051285        Pcmtd1 4.981224e+01 #> 21 ENSMUSG00000097797       Gm26901 4.276306e-04 #> 22 ENSMUSG00000103067       Gm30414 0.000000e+00 #> 23 ENSMUSG00000025909         Sntg1 1.083131e+00 #> 24 ENSMUSG00000061024          Rrs1 1.929504e+01 #> 25 ENSMUSG00000025911        Adhfe1 1.163515e+01 #> 26 ENSMUSG00000067879           Vxn 9.911623e+00 #> 27 ENSMUSG00000099827       Gm29520 0.000000e+00 #> 28 ENSMUSG00000025912         Mybl1 2.439775e-01 #> 29 ENSMUSG00000045210        Vcpip1 3.177732e+01 #> 30 ENSMUSG00000097893 1700034P13Rik 5.257291e-01 #> 31 ENSMUSG00000025915          Sgk3 1.850455e+01 #> 32 ENSMUSG00000046101        Mcmdc2 6.555578e-01 #> 33 ENSMUSG00000098234         Snhg6 6.245488e+00 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 52359 rows ]"},{"path":"/articles/census_compute_over_X.html","id":"counting-cells-grouped-by-dataset-and-gene","dir":"Articles","previous_headings":"","what":"Counting cells grouped by dataset and gene","title":"Computing on X using online (incremental) algorithms","text":"goal example count number cells nonzero reads, grouped gene Census dataset_id. result data frame dataset, gene, number cells nonzero reads dataset gene. multi-factor aggregation, ’ll take advantage dplyr routines instead lower-level vector indexer shown . presentation purposes, ’ll limit query four genes, can expanded genes easily. Don’t forget close census.","code":"library(\"dplyr\")  query <- census$get(\"census_data\")$get(\"mus_musculus\")$axis_query(   measurement_name = \"RNA\",   obs_query = SOMAAxisQuery$new(value_filter = \"tissue=='brain'\"),   var_query = SOMAAxisQuery$new(value_filter = \"feature_name %in% c('Malat1', 'Ptprd', 'Dlg2', 'Pcdh9')\") )  obs_tbl <- query$obs(column_names=c(\"soma_joinid\", \"dataset_id\"))$concat() obs_df <- data.frame(   # materialize soma_joinid as character to avoid overflowing R 32-bit integer   cell_id = as.character(obs_tbl$soma_joinid),   dataset_id = obs_tbl$dataset_id$as_vector() ) var_tbl <- query$var(column_names=c(\"soma_joinid\", \"feature_name\"))$concat() var_df <- data.frame(   gene_id = as.character(var_tbl$soma_joinid),   feature_name = var_tbl$feature_name$as_vector() )  # accumulator for # cells by dataset & gene n_cells_grouped <- data.frame(   \"dataset_id\" = character(0),   \"gene_id\" = character(0),   \"n_cells\" = numeric(0) )  # iterate through in-memory shards of query results tables <- query$X(\"raw\")$tables() while (!tables$read_complete()) {   table_part <- tables$read_next()    # prepare a (dataset,gene,1) tuple for each entry in table_part   n_cells_part <- data.frame(     \"cell_id\" = as.character(table_part$soma_dim_0),     \"gene_id\" = as.character(table_part$soma_dim_1),     \"n_cells\" = 1   )   n_cells_part <- left_join(n_cells_part, obs_df, by = \"cell_id\")   stopifnot(sum(is.null(n_cells_part$dataset_id)) == 0)    # fold those into n_cells_grouped   n_cells_grouped <- n_cells_part %>%                      select(-cell_id) %>%                      bind_rows(n_cells_grouped) %>%                       group_by(dataset_id, gene_id) %>%                       summarise(n_cells = sum(n_cells)) %>%                       ungroup() }  # add gene names for display n_cells_grouped <- left_join(n_cells_grouped, var_df, by = \"gene_id\") stopifnot(sum(is.null(n_cells_grouped$feature_name)) == 0) n_cells_grouped[c(\"dataset_id\", \"feature_name\", \"n_cells\")] #> # A tibble: 17 × 3 #>    dataset_id                           feature_name n_cells #>    <chr>                                <chr>          <dbl> #>  1 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Dlg2           79513 #>  2 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Pcdh9          79476 #>  3 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Malat1         79667 #>  4 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Ptprd          79578 #>  5 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Dlg2              81 #>  6 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Pcdh9            125 #>  7 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Malat1         12622 #>  8 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Ptprd            474 #>  9 66ff82b4-9380-469c-bc4b-cfa08eacd325 Dlg2             856 #> 10 66ff82b4-9380-469c-bc4b-cfa08eacd325 Pcdh9           2910 #> 11 66ff82b4-9380-469c-bc4b-cfa08eacd325 Malat1          7102 #> 12 98e5ea9f-16d6-47ec-a529-686e76515e39 Dlg2             908 #> 13 98e5ea9f-16d6-47ec-a529-686e76515e39 Pcdh9           3027 #> 14 98e5ea9f-16d6-47ec-a529-686e76515e39 Malat1         20094 #> 15 c08f8441-4a10-4748-872a-e70c0bcccdba Dlg2              52 #> 16 c08f8441-4a10-4748-872a-e70c0bcccdba Pcdh9            117 #> 17 c08f8441-4a10-4748-872a-e70c0bcccdba Malat1         12992 census$close()"},{"path":"/articles/census_dataset_presence.html","id":"opening-the-census","dir":"Articles","previous_headings":"","what":"Opening the Census","title":"Genes measured in each cell (dataset presence matrix)","text":"cellxgene.census R package contains convenient API open version Census (default, newest stable version).","code":"library(\"cellxgene.census\") census <- open_soma()"},{"path":"/articles/census_dataset_presence.html","id":"fetching-the-ids-of-the-census-datasets","dir":"Articles","previous_headings":"","what":"Fetching the IDs of the Census datasets","title":"Genes measured in each cell (dataset presence matrix)","text":"Let’s grab table datasets included Census use table combination presence matrix .","code":"# Grab the experiment containing human data, and the measurement therein with RNA human <- census$get(\"census_data\")$get(\"homo_sapiens\") human_rna <- human$ms$get(\"RNA\")  # The census-wide datasets datasets_df <- as.data.frame(census$get(\"census_info\")$get(\"datasets\")$read()$concat()) print(datasets_df) #>    soma_joinid                        collection_id #> 1            0 e2c257e7-6f79-487c-b81c-39451cd4ab3c #> 2            1 e2c257e7-6f79-487c-b81c-39451cd4ab3c #> 3            2 e2c257e7-6f79-487c-b81c-39451cd4ab3c #> 4            3 f7cecffa-00b4-4560-a29a-8ad626b8ee08 #> 5            4 3f50314f-bdc9-40c6-8e4a-b0901ebfbe4c #> 6            5 e5f58829-1a66-40b5-a624-9046778e74f5 #> 7            6 e5f58829-1a66-40b5-a624-9046778e74f5 #> 8            7 e5f58829-1a66-40b5-a624-9046778e74f5 #> 9            8 e5f58829-1a66-40b5-a624-9046778e74f5 #> 10           9 e5f58829-1a66-40b5-a624-9046778e74f5 #> 11          10 e5f58829-1a66-40b5-a624-9046778e74f5 #> 12          11 e5f58829-1a66-40b5-a624-9046778e74f5 #>                                                                                                                             collection_name #> 1                                                                      Spatial multiomics map of trophoblast development in early pregnancy #> 2                                                                      Spatial multiomics map of trophoblast development in early pregnancy #> 3                                                                      Spatial multiomics map of trophoblast development in early pregnancy #> 4                                       Mapping single-cell transcriptomes in the intra-tumoral and associated territories of kidney cancer #> 5  Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy #> 6                                                                                                                            Tabula Sapiens #> 7                                                                                                                            Tabula Sapiens #> 8                                                                                                                            Tabula Sapiens #> 9                                                                                                                            Tabula Sapiens #> 10                                                                                                                           Tabula Sapiens #> 11                                                                                                                           Tabula Sapiens #> 12                                                                                                                           Tabula Sapiens #>                 collection_doi                           dataset_id #> 1   10.1038/s41586-023-05869-0 f171db61-e57e-4535-a06a-35d8b6ef8f2b #> 2   10.1038/s41586-023-05869-0 ecf2e08e-2032-4a9e-b466-b65b395f4a02 #> 3   10.1038/s41586-023-05869-0 74cff64f-9da9-4b2a-9b3b-8a04a1598040 #> 4  10.1016/j.ccell.2022.11.001 5af90777-6760-4003-9dba-8f945fec6fdf #> 5  10.1016/j.ccell.2021.03.007 bd65a70f-b274-4133-b9dd-0d1431b6af34 #> 6      10.1126/science.abl4896 ff45e623-7f5f-46e3-b47d-56be0341f66b #> 7      10.1126/science.abl4896 f01bdd17-4902-40f5-86e3-240d66dd2587 #> 8      10.1126/science.abl4896 e6a11140-2545-46bc-929e-da243eed2cae #> 9      10.1126/science.abl4896 e5c63d94-593c-4338-a489-e1048599e751 #> 10     10.1126/science.abl4896 d8732da6-8d1d-42d9-b625-f2416c30054b #> 11     10.1126/science.abl4896 d77ec7d6-ef2e-49d6-9e79-05b7f8881484 #> 12     10.1126/science.abl4896 cee11228-9f0b-4e57-afe2-cfe15ee56312 #>                                                                                                                               dataset_title #> 1                                                                                                                    donor_p13_trophoblasts #> 2                                                                                                                   All donors trophoblasts #> 3                                                                                                      All donors all cell states (in vivo) #> 4                                                                      Single-cell transcriptomic datasets of Renal cell carcinoma patients #> 5  Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy #> 6                                                                                                                 Tabula Sapiens - Pancreas #> 7                                                                                                           Tabula Sapiens - Salivary_Gland #> 8                                                                                                                    Tabula Sapiens - Heart #> 9                                                                                                                  Tabula Sapiens - Bladder #> 10                                                                                                                 Tabula Sapiens - Trachea #> 11                                                                                                                Tabula Sapiens - Prostate #> 12                                                                                                                  Tabula Sapiens - Spleen #>                            dataset_h5ad_path dataset_total_cell_count #> 1  f171db61-e57e-4535-a06a-35d8b6ef8f2b.h5ad                    31497 #> 2  ecf2e08e-2032-4a9e-b466-b65b395f4a02.h5ad                    67070 #> 3  74cff64f-9da9-4b2a-9b3b-8a04a1598040.h5ad                   286326 #> 4  5af90777-6760-4003-9dba-8f945fec6fdf.h5ad                   270855 #> 5  bd65a70f-b274-4133-b9dd-0d1431b6af34.h5ad                   167283 #> 6  ff45e623-7f5f-46e3-b47d-56be0341f66b.h5ad                    13497 #> 7  f01bdd17-4902-40f5-86e3-240d66dd2587.h5ad                    27199 #> 8  e6a11140-2545-46bc-929e-da243eed2cae.h5ad                    11505 #> 9  e5c63d94-593c-4338-a489-e1048599e751.h5ad                    24583 #> 10 d8732da6-8d1d-42d9-b625-f2416c30054b.h5ad                     9522 #> 11 d77ec7d6-ef2e-49d6-9e79-05b7f8881484.h5ad                    16375 #> 12 cee11228-9f0b-4e57-afe2-cfe15ee56312.h5ad                    34004 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 581 rows ]"},{"path":"/articles/census_dataset_presence.html","id":"fetching-the-dataset-presence-matrix","dir":"Articles","previous_headings":"","what":"Fetching the dataset presence matrix","title":"Genes measured in each cell (dataset presence matrix)","text":"Now let’s fetch dataset presence matrix. convenience, read entire presence matrix (Homo sapiens) sparse matrix. convenience function providing capability: also need var dataframe, read R data frame convenient manipulation:","code":"presence_matrix <- get_presence_matrix(census, \"Homo sapiens\", \"RNA\") print(dim(presence_matrix)) #> NULL var_df <- as.data.frame(human_rna$var$read()$concat()) print(var_df) #>    soma_joinid      feature_id feature_name feature_length #> 1            0 ENSG00000121410         A1BG           3999 #> 2            1 ENSG00000268895     A1BG-AS1           3374 #> 3            2 ENSG00000148584         A1CF           9603 #> 4            3 ENSG00000175899          A2M           6318 #> 5            4 ENSG00000245105      A2M-AS1           2948 #> 6            5 ENSG00000166535        A2ML1           7156 #> 7            6 ENSG00000256661    A2ML1-AS1            452 #> 8            7 ENSG00000184389      A3GALT2           1023 #> 9            8 ENSG00000128274       A4GALT           3358 #> 10           9 ENSG00000118017        A4GNT           1779 #> 11          10 ENSG00000094914         AAAS           4727 #> 12          11 ENSG00000081760         AACS          16039 #> 13          12 ENSG00000114771        AADAC           1632 #> 14          13 ENSG00000197953      AADACL2           5071 #> 15          14 ENSG00000242908  AADACL2-AS1            635 #> 16          15 ENSG00000188984      AADACL3           4055 #> 17          16 ENSG00000204518      AADACL4           2027 #> 18          17 ENSG00000109576        AADAT           2970 #> 19          18 ENSG00000158122       PRXL2C           3098 #> 20          19 ENSG00000103591        AAGAB           4138 #> 21          20 ENSG00000115977         AAK1          24843 #> 22          21 ENSG00000087884        AAMDC           1943 #> 23          22 ENSG00000127837         AAMP           3055 #> 24          23 ENSG00000129673        AANAT           2156 #> 25          24 ENSG00000131043         AAR2           7291 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 60639 rows ]"},{"path":"/articles/census_dataset_presence.html","id":"identifying-genes-measured-in-a-specific-dataset","dir":"Articles","previous_headings":"","what":"Identifying genes measured in a specific dataset","title":"Genes measured in each cell (dataset presence matrix)","text":"Now dataset table, genes metadata table, dataset presence matrix, can check gene set genes measured specific dataset. Important: presence matrix indexed soma_joinid, positionally indexed. words: first dimension presence matrix dataset’s soma_joinid, stored census_datasets dataframe. second dimension presence matrix feature’s soma_joinid, stored var dataframe. presence matrix method $take() lets slice soma_joinids census_datasets var. full presence matrix, slices , can exported regular matrix method $get_one_based_matrix() Let’s find gene \"ENSG00000286096\" measured dataset id \"97a17473-e2b1-4f31-a544-44a60773e2dd\".","code":"# Get soma_joinid for datasets and genes of interest var_joinid <- var_df$soma_joinid[var_df$feature_id == \"ENSG00000286096\"] dataset_joinid <- datasets_df$soma_joinid[datasets_df$dataset_id == \"97a17473-e2b1-4f31-a544-44a60773e2dd\"]  # Slice presence matrix with datasets and genes of interest presence_matrix_slice <- presence_matrix$take(i = dataset_joinid, j = var_joinid)  # Convert presence matrix to regular matrix presence_matrix_slice <- presence_matrix_slice$get_one_based_matrix()  # Find how if the gene is present in this dataset is_present <- presence_matrix_slice[, , drop = TRUE] cat(paste(\"Feature is\", if (is_present) \"present.\" else \"not present.\")) #> Feature is present."},{"path":"/articles/census_dataset_presence.html","id":"identifying-datasets-that-measured-specific-genes","dir":"Articles","previous_headings":"","what":"Identifying datasets that measured specific genes","title":"Genes measured in each cell (dataset presence matrix)","text":"Similarly, can determine datasets measured specific gene set genes.","code":"# Grab the feature's soma_joinid from the var dataframe var_joinid <- var_df$soma_joinid[var_df$feature_id == \"ENSG00000286096\"]  # The presence matrix is indexed by the joinids of the dataset and var dataframes, # so slice out the feature of interest by its joinid. presence_matrix_slice  <- presence_matrix$take(j = var_joinid)$get_one_based_matrix() measured_datasets <- presence_matrix_slice[, , drop = TRUE] != 0 dataset_joinids <- datasets_df$soma_joinid[measured_datasets]  # From the datasets dataframe, slice out the datasets which have a joinid in the list print(datasets_df[dataset_joinids, ]) #>    soma_joinid                        collection_id #> 5            4 3f50314f-bdc9-40c6-8e4a-b0901ebfbe4c #> 6            5 e5f58829-1a66-40b5-a624-9046778e74f5 #> 7            6 e5f58829-1a66-40b5-a624-9046778e74f5 #> 8            7 e5f58829-1a66-40b5-a624-9046778e74f5 #> 9            8 e5f58829-1a66-40b5-a624-9046778e74f5 #> 11          10 e5f58829-1a66-40b5-a624-9046778e74f5 #> 12          11 e5f58829-1a66-40b5-a624-9046778e74f5 #> 14          13 e5f58829-1a66-40b5-a624-9046778e74f5 #> 15          14 e5f58829-1a66-40b5-a624-9046778e74f5 #> 19          18 e5f58829-1a66-40b5-a624-9046778e74f5 #> 20          19 e5f58829-1a66-40b5-a624-9046778e74f5 #> 21          20 e5f58829-1a66-40b5-a624-9046778e74f5 #>                                                                                                                             collection_name #> 5  Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy #> 6                                                                                                                            Tabula Sapiens #> 7                                                                                                                            Tabula Sapiens #> 8                                                                                                                            Tabula Sapiens #> 9                                                                                                                            Tabula Sapiens #> 11                                                                                                                           Tabula Sapiens #> 12                                                                                                                           Tabula Sapiens #> 14                                                                                                                           Tabula Sapiens #> 15                                                                                                                           Tabula Sapiens #> 19                                                                                                                           Tabula Sapiens #> 20                                                                                                                           Tabula Sapiens #> 21                                                                                                                           Tabula Sapiens #>                 collection_doi                           dataset_id #> 5  10.1016/j.ccell.2021.03.007 bd65a70f-b274-4133-b9dd-0d1431b6af34 #> 6      10.1126/science.abl4896 ff45e623-7f5f-46e3-b47d-56be0341f66b #> 7      10.1126/science.abl4896 f01bdd17-4902-40f5-86e3-240d66dd2587 #> 8      10.1126/science.abl4896 e6a11140-2545-46bc-929e-da243eed2cae #> 9      10.1126/science.abl4896 e5c63d94-593c-4338-a489-e1048599e751 #> 11     10.1126/science.abl4896 d77ec7d6-ef2e-49d6-9e79-05b7f8881484 #> 12     10.1126/science.abl4896 cee11228-9f0b-4e57-afe2-cfe15ee56312 #> 14     10.1126/science.abl4896 a2d4d33e-4c62-4361-b80a-9be53d2e50e8 #> 15     10.1126/science.abl4896 a0754256-f44b-4c4a-962c-a552e47d3fdc #> 19     10.1126/science.abl4896 6d41668c-168c-4500-b06a-4674ccf3e19d #> 20     10.1126/science.abl4896 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c #> 21     10.1126/science.abl4896 55cf0ea3-9d2b-4294-871e-bb4b49a79fc7 #>                                                                                                                               dataset_title #> 5  Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy #> 6                                                                                                                 Tabula Sapiens - Pancreas #> 7                                                                                                           Tabula Sapiens - Salivary_Gland #> 8                                                                                                                    Tabula Sapiens - Heart #> 9                                                                                                                  Tabula Sapiens - Bladder #> 11                                                                                                                Tabula Sapiens - Prostate #> 12                                                                                                                  Tabula Sapiens - Spleen #> 14                                                                                                             Tabula Sapiens - Vasculature #> 15                                                                                                                     Tabula Sapiens - Eye #> 19                                                                                                                   Tabula Sapiens - Liver #> 20                                                                                                                     Tabula Sapiens - Fat #> 21                                                                                                                  Tabula Sapiens - Tongue #>                            dataset_h5ad_path dataset_total_cell_count #> 5  bd65a70f-b274-4133-b9dd-0d1431b6af34.h5ad                   167283 #> 6  ff45e623-7f5f-46e3-b47d-56be0341f66b.h5ad                    13497 #> 7  f01bdd17-4902-40f5-86e3-240d66dd2587.h5ad                    27199 #> 8  e6a11140-2545-46bc-929e-da243eed2cae.h5ad                    11505 #> 9  e5c63d94-593c-4338-a489-e1048599e751.h5ad                    24583 #> 11 d77ec7d6-ef2e-49d6-9e79-05b7f8881484.h5ad                    16375 #> 12 cee11228-9f0b-4e57-afe2-cfe15ee56312.h5ad                    34004 #> 14 a2d4d33e-4c62-4361-b80a-9be53d2e50e8.h5ad                    16037 #> 15 a0754256-f44b-4c4a-962c-a552e47d3fdc.h5ad                    10650 #> 19 6d41668c-168c-4500-b06a-4674ccf3e19d.h5ad                     5007 #> 20 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c.h5ad                    20263 #> 21 55cf0ea3-9d2b-4294-871e-bb4b49a79fc7.h5ad                    15020 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 30 rows ]"},{"path":"/articles/census_dataset_presence.html","id":"identifying-all-genes-measured-in-a-dataset","dir":"Articles","previous_headings":"","what":"Identifying all genes measured in a dataset","title":"Genes measured in each cell (dataset presence matrix)","text":"Finally, can find set genes measured cells given dataset.","code":"# Slice the dataset(s) of interest, and get the joinid(s) dataset_joinids <- datasets_df$soma_joinid[datasets_df$collection_id == \"17481d16-ee44-49e5-bcf0-28c0780d8c4a\"]  # Slice the presence matrix by the first dimension, i.e., by dataset presence_matrix_slice <- presence_matrix$take(i = dataset_joinids)$get_one_based_matrix() genes_measured <- Matrix::colSums(presence_matrix_slice) > 0 var_joinids <- var_df$soma_joinid[genes_measured]  print(var_df[var_joinids, ]) #>    soma_joinid      feature_id feature_name feature_length #> 1            0 ENSG00000121410         A1BG           3999 #> 2            1 ENSG00000268895     A1BG-AS1           3374 #> 3            2 ENSG00000148584         A1CF           9603 #> 4            3 ENSG00000175899          A2M           6318 #> 5            4 ENSG00000245105      A2M-AS1           2948 #> 6            5 ENSG00000166535        A2ML1           7156 #> 8            7 ENSG00000184389      A3GALT2           1023 #> 9            8 ENSG00000128274       A4GALT           3358 #> 10           9 ENSG00000118017        A4GNT           1779 #> 11          10 ENSG00000094914         AAAS           4727 #> 12          11 ENSG00000081760         AACS          16039 #> 13          12 ENSG00000114771        AADAC           1632 #> 14          13 ENSG00000197953      AADACL2           5071 #> 16          15 ENSG00000188984      AADACL3           4055 #> 17          16 ENSG00000204518      AADACL4           2027 #> 18          17 ENSG00000109576        AADAT           2970 #> 19          18 ENSG00000158122       PRXL2C           3098 #> 20          19 ENSG00000103591        AAGAB           4138 #> 21          20 ENSG00000115977         AAK1          24843 #> 22          21 ENSG00000087884        AAMDC           1943 #> 23          22 ENSG00000127837         AAMP           3055 #> 24          23 ENSG00000129673        AANAT           2156 #> 25          24 ENSG00000131043         AAR2           7291 #> 26          25 ENSG00000205002         AARD           2404 #> 27          26 ENSG00000090861        AARS1          10248 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 27185 rows ]"},{"path":"/articles/census_dataset_presence.html","id":"close-the-census","dir":"Articles","previous_headings":"Identifying all genes measured in a dataset","what":"Close the census","title":"Genes measured in each cell (dataset presence matrix)","text":"use, census object closed release memory resources. also closes SOMA objects accessed via top-level census. Closing can automated using .exit(census$close(), add = TRUE) immediately census <- open_soma().","code":"census$close()"},{"path":"/articles/census_datasets.html","id":"fetching-the-datasets-table","dir":"Articles","previous_headings":"","what":"Fetching the datasets table","title":"Census Datasets example","text":"Census contains top-level data frame itemizing datasets contained therein. can read SOMADataFrame Arrow Table: R data frame: sum cell counts across datasets match number cells across SOMA experiments (human, mouse).","code":"library(\"cellxgene.census\") census <- open_soma() census_datasets <- census$get(\"census_info\")$get(\"datasets\")$read()$concat() print(census_datasets) #> Table #> 593 rows x 8 columns #> $soma_joinid <int64 not null> #> $collection_id <large_string not null> #> $collection_name <large_string not null> #> $collection_doi <large_string not null> #> $dataset_id <large_string not null> #> $dataset_title <large_string not null> #> $dataset_h5ad_path <large_string not null> #> $dataset_total_cell_count <int64 not null> census_datasets <- as.data.frame(census_datasets) print(census_datasets[, c(   \"dataset_id\",   \"dataset_title\",   \"dataset_total_cell_count\" )]) #>                              dataset_id #> 1  f171db61-e57e-4535-a06a-35d8b6ef8f2b #> 2  ecf2e08e-2032-4a9e-b466-b65b395f4a02 #> 3  74cff64f-9da9-4b2a-9b3b-8a04a1598040 #> 4  5af90777-6760-4003-9dba-8f945fec6fdf #> 5  bd65a70f-b274-4133-b9dd-0d1431b6af34 #> 6  ff45e623-7f5f-46e3-b47d-56be0341f66b #> 7  f01bdd17-4902-40f5-86e3-240d66dd2587 #> 8  e6a11140-2545-46bc-929e-da243eed2cae #> 9  e5c63d94-593c-4338-a489-e1048599e751 #> 10 d8732da6-8d1d-42d9-b625-f2416c30054b #> 11 d77ec7d6-ef2e-49d6-9e79-05b7f8881484 #> 12 cee11228-9f0b-4e57-afe2-cfe15ee56312 #> 13 a357414d-2042-4eb5-95f0-c58604a18bdd #> 14 a2d4d33e-4c62-4361-b80a-9be53d2e50e8 #> 15 a0754256-f44b-4c4a-962c-a552e47d3fdc #> 16 983d5ec9-40e8-4512-9e65-a572a9c486cb #> 17 7357cee7-9f7f-4ab0-8cec-90de8f047e38 #> 18 6ec405bb-4727-4c6d-ab4e-01fe489af7ea #> 19 6d41668c-168c-4500-b06a-4674ccf3e19d #> 20 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c #> 21 55cf0ea3-9d2b-4294-871e-bb4b49a79fc7 #> 22 4f1555bc-4664-46c3-a606-78d34dd10d92 #> 23 2ba40233-8576-4dec-a5f1-2adfa115e2dc #> 24 2423ce2c-3149-4cca-a2ff-cf682ea29b5f #> 25 1c9eb291-6d31-47e1-96b2-129b5e1ae64f #> 26 18eb630b-a754-4111-8cd4-c24ec80aa5ec #> 27 0d2ee4ac-05ee-40b2-afb6-ebb584caa867 #> 28 0ced5e76-6040-47ff-8a72-93847965afc0 #> 29 0041b9c3-6a49-4bf7-8514-9bc7190067a7 #> 30 c8f83821-a242-4ed7-86e9-7da077f5d348 #> 31 c05e6940-729c-47bd-a2a6-6ce3730c4919 #> 32 894573ad-498f-47ee-9bec-ad0880147eea #> 33 84242d25-f656-4ca6-8e8d-f3d2beeba11f #> 34 3d044b52-140a-4528-bf0d-a2dbef9e1f40 #> 35 12194ced-8086-458e-84a8-e2ab935d8db1 #> 36 965386e9-1e4f-466d-bf59-ebdca4b66b9b #> 37 e47c65a8-7d2f-48b8-908e-04ea6505fa26 #> 38 c8d40d53-387b-48f2-9f89-72bfdb9c7c9f #> 39 a41202e6-173c-477c-8b4d-e0688ee1c4cb #> 40 7f08cbcc-5790-4576-8478-10e9a999b316 #> 41 3d0d6923-a2c4-476f-a53e-3b7bfa010d90 #> 42 2a7f90de-098a-4a6f-ac07-9e6462792412 #> 43 d7291f04-fbbb-4d65-990a-f01fa44e915b #> 44 8e10f1c4-8e98-41e5-b65f-8cd89a887122 #> 45 9d8e5dca-03a3-457d-b7fb-844c75735c83 #> 46 a6388a6f-6076-401b-9b30-7d4306a20035 #> 47 842c6f5d-4a94-4eef-8510-8c792d1124bc #> 48 74520626-b0ba-4ee9-86b5-714649554def #> 49 396a9124-fb20-4822-bf9c-e93fdf7c999a #> 50 e84f2780-51e8-4cfa-8aa0-13bbfef677c7 #> 51 dfdf1ae2-d624-4004-9353-f18b902f6bca #> 52 d1cbed97-d88f-4954-8925-13302fe30b39 #> 53 b03e4ef8-4e6b-47f4-84a7-e8ed033d08cd #> 54 f1f123cc-ca2c-460f-b7f1-88240efb1e82 #> 55 de94c504-4b58-4f42-b68d-74a8e4892f0e #> 56 da684768-fb01-455b-9f0f-b63a3e2f844f #> 57 9f222629-9e39-47d0-b83f-e08d610c7479 #> 58 b0e547f0-462b-4f81-b31b-5b0a5d96f537 #> 59 d41f45c1-1b7b-4573-a998-ac5c5acb1647 #> 60 f801b7a9-80a6-4d09-9161-71474deb58ae #> 61 be39785b-67cb-4177-be19-a40ee3747e45 #> 62 4c6f9f26-5470-455b-8933-c408232fbf56 #> 63 be35c935-ee4f-475c-9d3c-97630d59a735 #> 64 975e13b6-bec1-4eed-b46a-9be1f1357373 #> 65 24ec2dc5-3573-4d66-a9e1-25b7dcf43e27 #> 66 0ba636a1-4754-4786-a8be-7ab3cf760fd6 #> 67 c2876b1b-06d8-4d96-a56b-5304f815b99a #> 68 3f32121d-126b-4e8d-9f69-d86502d2a1b1 #> 69 be46dfdc-0f99-4731-8957-64ca37364985 #> 70 ac2fea99-ce08-4fca-8d03-a19f37bf21a3 #> 71 a13bda79-9134-46c9-9ed1-a2858be9aafe #> 72 5695d556-974e-4d92-9e99-5f61b8695313 #> 73 535e9336-2d8d-43c3-944d-bcbebe20df8a #> 74 4fb330ab-2d74-4649-b58f-7ffef457efdf #> 75 290d50c7-7158-4198-acf5-6d4b624fd3dc #> 76 18e2a8c5-33f7-455e-a58a-b2ba6921db27 #> 77 12967895-3d58-4e93-be2c-4e1bcf4388d5 #> 78 ee195b7d-184d-4dfa-9b1c-51a7e601ac11 #> 79 9968be68-ab65-4a38-9e1a-c9b6abece194 #> 80 b165f033-9dec-468a-9248-802fc6902a74 #> 81 d8da613f-e681-4c69-b463-e94f5e66847f #> 82 fe4b89d5-461e-440c-a5a8-621b37b122c0 #> 83 a37f857c-779f-464e-9310-3db43a1811e7 #> 84 6cf3634d-e911-44ad-bf52-c747a9af3c01 #> 85 5ce42b38-d867-487f-9b40-e8bb00b21d0b #>                                                                                                                                     dataset_title #> 1                                                                                                                          donor_p13_trophoblasts #> 2                                                                                                                         All donors trophoblasts #> 3                                                                                                            All donors all cell states (in vivo) #> 4                                                                            Single-cell transcriptomic datasets of Renal cell carcinoma patients #> 5        Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy #> 6                                                                                                                       Tabula Sapiens - Pancreas #> 7                                                                                                                 Tabula Sapiens - Salivary_Gland #> 8                                                                                                                          Tabula Sapiens - Heart #> 9                                                                                                                        Tabula Sapiens - Bladder #> 10                                                                                                                       Tabula Sapiens - Trachea #> 11                                                                                                                      Tabula Sapiens - Prostate #> 12                                                                                                                        Tabula Sapiens - Spleen #> 13                                                                                                               Tabula Sapiens - Small_Intestine #> 14                                                                                                                   Tabula Sapiens - Vasculature #> 15                                                                                                                           Tabula Sapiens - Eye #> 16                                                                                                                         Tabula Sapiens - Blood #> 17                                                                                                               Tabula Sapiens - Large_Intestine #> 18                                                                                                                        Tabula Sapiens - Uterus #> 19                                                                                                                         Tabula Sapiens - Liver #> 20                                                                                                                           Tabula Sapiens - Fat #> 21                                                                                                                        Tabula Sapiens - Tongue #> 22                                                                                                                   Tabula Sapiens - Bone_Marrow #> 23                                                                                                                       Tabula Sapiens - Mammary #> 24                                                                                                                        Tabula Sapiens - Kidney #> 25                                                                                                                        Tabula Sapiens - Muscle #> 26                                                                                                                    Tabula Sapiens - Lymph_Node #> 27                                                                                                                          Tabula Sapiens - Lung #> 28                                                                                                                        Tabula Sapiens - Thymus #> 29                                                                                                                          Tabula Sapiens - Skin #> 30                                                                                                                      white matter - astrocytes #> 31                                                                                                                       white matter - all cells #> 32                                                                                                                         white matter - neurons #> 33                                                                                                                       white matter - microglia #> 34                                                                                                                  white matter - vascular cells #> 35                                                                                                                 white matter - oligodendroglia #> 36 Single cell RNA sequencing of bone marrow mononuclear cells from healthy donors and B-cell lymphoma patients following CD19 CAR T-cell therapy #> 37                                                                                                                scRNA-seq data - vascular cells #> 38                                                                                                            scRNA-seq data - perivascular cells #> 39                                                                                                               scRNA-seq data - lymphatic cells #> 40                                                                                                                     snRNA-seq data - all cells #> 41                                                                                                                   scRNA-seq data - fibroblasts #> 42                                                                                                              scRNA-seq data - epithelial cells #> 43                                                                               Single-cell RNA-seq for all cortical & hippocampal regions (10x) #> 44                                                                                                                                    All neurons #> 45                                                                                                                          22 integrated samples #> 46                                                                                                                 scRNA-seq data - myeloid cells #> 47                                                                                                                     scRNA-seq data - all cells #> 48                                                                                                                       scRNA-seq data - T cells #> 49                                                                                                                       scRNA-seq data - B cells #> 50                                                                                                             All cells from human liver dataset #> 51                                                                                                         Myeloid cells from human liver dataset #> 52                                                                                                   CD45 negative cells from human liver dataset #> 53                                                                                                        Lymphoid cells from human liver dataset #> 54                                                                                                 UMAP visualization of keratinocyte subclusters #> 55                                                                                                          UMAP visualization of all 12 datasets #> 56                                                                                                   UMAP visualization of fibroblast subclusters #> 57                                                                        An integrated cell atlas of the human lung in health and disease (full) #> 58                                         AIDA Phase 1: Chinese, Indian, Japanese, Korean, and Malay donors in Japan, Singapore, and South Korea #> 59           Transcriptional connectivity of regulatory T cells in the tumor microenvironment informs novel combination cancer therapy strategies #> 60          normal - Single-cell analyses of renal cell cancers reveal insights into tumor microenvironment, cell of origin, and therapy response #> 61           ccRCC - Single-cell analyses of renal cell cancers reveal insights into tumor microenvironment, cell of origin, and therapy response #> 62           chRCC - Single-cell analyses of renal cell cancers reveal insights into tumor microenvironment, cell of origin, and therapy response #> 63                                                                                                                                  HBCA - stroma #> 64                                                                                                                              HBCA - epithelial #> 65                                                                                                                                  HBCA - immune #> 66                                                                                                                                  HBCA - global #> 67                                                                               Whole Taxonomy - MTG: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 68                                                                                                 fetal and neonatal human small intestine cells #> 69                                                                                                                     Mouse Somatic Cell Lineage #> 70                                                                                                                      Human Immune Cell Lineage #> 71                                                                                                                                     Mouse Male #> 72                                                                                                                               Mouse Germ Cells #> 73                                                                                                                                     Human Male #> 74                                                                                                                     Human Somatic Cell Lineage #> 75                                                                                                                               Human Germ Cells #> 76                                                                                                                                   Human Female #> 77                                                                                                                                   Mouse Female #> 78                                                                                                                                 Adult duodenum #> 79                                                                                                                         Developing Human Atlas #> 80                                                                                                                         All non-neuronal cells #> 81                                                                                          A molecular single-cell lung atlas of lethal COVID-19 #> 82                                                                                                                                  TI epithelial #> 83                                                                                                                                      TI immune #> 84                                                                                                                                  colon stromal #> 85                                                                                                                               colon epithelial #>    dataset_total_cell_count #> 1                     31497 #> 2                     67070 #> 3                    286326 #> 4                    270855 #> 5                    167283 #> 6                     13497 #> 7                     27199 #> 8                     11505 #> 9                     24583 #> 10                     9522 #> 11                    16375 #> 12                    34004 #> 13                    12467 #> 14                    16037 #> 15                    10650 #> 16                    50115 #> 17                    13680 #> 18                     7124 #> 19                     5007 #> 20                    20263 #> 21                    15020 #> 22                    12297 #> 23                    11375 #> 24                     9641 #> 25                    30746 #> 26                    53275 #> 27                    35682 #> 28                    33664 #> 29                     9424 #> 30                     3596 #> 31                    45528 #> 32                    10734 #> 33                     3851 #> 34                     4880 #> 35                    21968 #> 36                    92676 #> 37                    83651 #> 38                    52638 #> 39                     8982 #> 40                   117346 #> 41                   208390 #> 42                   240804 #> 43                  1169213 #> 44                  2480956 #> 45                    72335 #> 46                    30789 #> 47                   714331 #> 48                    76567 #> 49                    12510 #> 50                   167598 #> 51                    40821 #> 52                    15481 #> 53                   105790 #> 54                     9471 #> 55                    15243 #> 56                     2303 #> 57                  2282447 #> 58                  1058909 #> 59                    82991 #> 60                     6044 #> 61                    20509 #> 62                     2576 #> 63                   413997 #> 64                   353167 #> 65                    23714 #> 66                   800198 #> 67                  1226855 #> 68                    36359 #> 69                    50933 #> 70                    20556 #> 71                    32889 #> 72                    10411 #> 73                   133811 #> 74                   191230 #> 75                    10993 #> 76                   213898 #> 77                    69709 #> 78                     5200 #> 79                   155232 #> 80                   888263 #> 81                   116313 #> 82                   154136 #> 83                   201072 #> 84                    39433 #> 85                    97788 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 508 rows ] census_data <- census$get(\"census_data\") all_experiments <- lapply(census_data$to_list(), function(x) census_data$get(x$name)) print(all_experiments) #> $homo_sapiens #> <SOMAExperiment> #>   uri: s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/census_data/homo_sapiens  #>   arrays: obs*  #>   groups: ms*  #>  #> $mus_musculus #> <SOMAExperiment> #>   uri: s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/census_data/mus_musculus  #>   arrays: obs*  #>   groups: ms* experiments_total_cells <- sum(sapply(all_experiments, function(x) {   nrow(x$obs$read(column_names = c(\"soma_joinid\"))$concat()) }))  print(paste(\"Found\", experiments_total_cells, \"cells in all experiments.\")) #> [1] \"Found 61656118 cells in all experiments.\" print(paste(   \"Found\", sum(as.vector(census_datasets$dataset_total_cell_count)),   \"cells in all datasets.\" )) #> [1] \"Found 61656118 cells in all datasets.\""},{"path":"/articles/census_datasets.html","id":"fetching-the-expression-data-from-a-single-dataset","dir":"Articles","previous_headings":"","what":"Fetching the expression data from a single dataset","title":"Census Datasets example","text":"Let’s pick one dataset slice census, turn Seurat -memory object. (requires Seurat package installed beforehand.) Create query mouse experiment, “RNA” measurement, dataset_id.","code":"census_datasets[census_datasets$dataset_id == \"0bd1a1de-3aee-40e0-b2ec-86c7a30c7149\", ] #>     soma_joinid                        collection_id    collection_name #> 523         522 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis #>                collection_doi                           dataset_id #> 523 10.1038/s41586-020-2496-1 0bd1a1de-3aee-40e0-b2ec-86c7a30c7149 #>                                                                                        dataset_title #> 523 Bone marrow - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - 10x #>                             dataset_h5ad_path dataset_total_cell_count #> 523 0bd1a1de-3aee-40e0-b2ec-86c7a30c7149.h5ad                    40220 library(\"tiledbsoma\") obs_query <- SOMAAxisQuery$new(   value_filter = \"dataset_id == '0bd1a1de-3aee-40e0-b2ec-86c7a30c7149'\" ) expt_query <- census_data$get(\"mus_musculus\")$axis_query(   measurement_name = \"RNA\",   obs_query = obs_query ) dataset_seurat <- expt_query$to_seurat(c(counts = \"raw\")) print(dataset_seurat) #> An object of class Seurat  #> 52392 features across 40220 samples within 1 assay  #> Active assay: RNA (52392 features, 0 variable features) #>  2 layers present: counts, data"},{"path":"/articles/census_datasets.html","id":"downloading-the-original-source-h5ad-file-of-a-dataset","dir":"Articles","previous_headings":"","what":"Downloading the original source H5AD file of a dataset","title":"Census Datasets example","text":"can use cellxgene.census::get_source_h5ad_uri() API fetch URI pointing H5AD associated dataset_id. H5AD can download CZ CELLxGENE Discover, may contain additional data-submitter provided information included Census. can fetch location cloud directly download system. local H5AD file can used R using SeuratDisk’s anndata converter.","code":"# Option 1: Direct download download_source_h5ad(   dataset_id = \"0bd1a1de-3aee-40e0-b2ec-86c7a30c7149\",   file = \"/tmp/Tabula_Muris_Senis-bone_marrow.h5ad\",   overwrite = TRUE ) # Option 2: Get location and download via preferred method get_source_h5ad_uri(\"0bd1a1de-3aee-40e0-b2ec-86c7a30c7149\") #> $uri #> [1] \"s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/h5ads/0bd1a1de-3aee-40e0-b2ec-86c7a30c7149.h5ad\" #>  #> $s3_region #> [1] \"us-west-2\""},{"path":"/articles/census_datasets.html","id":"close-the-census","dir":"Articles","previous_headings":"Downloading the original source H5AD file of a dataset","what":"Close the census","title":"Census Datasets example","text":"use, census object closed release memory resources. also closes SOMA objects accessed via top-level census. Closing can automated using .exit(census$close(), add = TRUE) immediately census <- open_soma().","code":"census$close()"},{"path":"/articles/census_query_extract.html","id":"opening-the-census","dir":"Articles","previous_headings":"","what":"Opening the census","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"cellxgene.census R package contains convenient API open version Census (default, newest stable version). can learn cellxgene.census methods accessing corresponding documentation, example ?cellxgene.census::open_soma.","code":"library(\"cellxgene.census\") census <- open_soma()"},{"path":"/articles/census_query_extract.html","id":"querying-cell-metadata-obs","dir":"Articles","previous_headings":"","what":"Querying cell metadata (obs)","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"human gene metadata Census, RNA assays, located census$get(\"census_data\")$get(\"homo_sapiens\")$obs. SOMADataFrame can materialized R data frame (tibble) using .data.frame(obs$read()$concat()). mouse cell metadata census$get(\"census_data\")$get(\"mus_musculus\").obs. slicing cell metadata two relevant arguments can passed read(): column_names — character vector indicating metadata columns fetch. Expressions one comparisons Comparisons one <column> <op> <value> <column> <op> <column> Expressions can combine comparisons using && || op one < | > | <= | >= | == | != %% learn metadata columns available fetching filtering can directly look keys cell metadata. soma_joinid special SOMADataFrame column used join operations. definition columns can found Census schema. can used fetch specific columns specific rows matching condition. latter need know values looking priori. example let’s see possible values available sex. can load cell metadata fetching column sex. can see three different values sex, \"male\", \"female\" \"unknown\". information can fetch cell metatadata specific sex value, example \"unknown\". can use column_names value_filter perform specific queries. example let’s fetch disease column cell_type \"B cell\" tissue_general \"lung\".","code":"census$get(\"census_data\")$get(\"homo_sapiens\")$obs$colnames() #>  [1] \"soma_joinid\"                              #>  [2] \"dataset_id\"                               #>  [3] \"assay\"                                    #>  [4] \"assay_ontology_term_id\"                   #>  [5] \"cell_type\"                                #>  [6] \"cell_type_ontology_term_id\"               #>  [7] \"development_stage\"                        #>  [8] \"development_stage_ontology_term_id\"       #>  [9] \"disease\"                                  #> [10] \"disease_ontology_term_id\"                 #> [11] \"donor_id\"                                 #> [12] \"is_primary_data\"                          #> [13] \"self_reported_ethnicity\"                  #> [14] \"self_reported_ethnicity_ontology_term_id\" #> [15] \"sex\"                                      #> [16] \"sex_ontology_term_id\"                     #> [17] \"suspension_type\"                          #> [18] \"tissue\"                                   #> [19] \"tissue_ontology_term_id\"                  #> [20] \"tissue_general\"                           #> [21] \"tissue_general_ontology_term_id\" unique(as.data.frame(census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(column_names = \"sex\")$concat())) #>            sex #> 1      unknown #> 670     female #> 385438    male as.data.frame(census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(value_filter = \"sex == 'unknown'\")$concat()) #>    soma_joinid                           dataset_id     assay assay_ontology_term_id #> 1            0 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #> 2            1 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #> 3            2 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #> 4            3 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #> 5            4 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #> 6            5 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #> 7            6 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #> 8            7 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #> 9            8 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #> 10           9 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #> 11          10 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #> 12          11 f171db61-e57e-4535-a06a-35d8b6ef8f2b 10x 3' v3            EFO:0009922 #>                        cell_type cell_type_ontology_term_id #> 1       syncytiotrophoblast cell                 CL:0000525 #> 2  placental villous trophoblast                 CL:2000060 #> 3       syncytiotrophoblast cell                 CL:0000525 #> 4       syncytiotrophoblast cell                 CL:0000525 #> 5       extravillous trophoblast                 CL:0008036 #> 6  placental villous trophoblast                 CL:2000060 #> 7       syncytiotrophoblast cell                 CL:0000525 #> 8       extravillous trophoblast                 CL:0008036 #> 9  placental villous trophoblast                 CL:2000060 #> 10      syncytiotrophoblast cell                 CL:0000525 #> 11      syncytiotrophoblast cell                 CL:0000525 #> 12      syncytiotrophoblast cell                 CL:0000525 #>                          development_stage development_stage_ontology_term_id disease #> 1  9th week post-fertilization human stage                     HsapDv:0000046  normal #> 2  9th week post-fertilization human stage                     HsapDv:0000046  normal #> 3  9th week post-fertilization human stage                     HsapDv:0000046  normal #> 4  9th week post-fertilization human stage                     HsapDv:0000046  normal #> 5  9th week post-fertilization human stage                     HsapDv:0000046  normal #> 6  9th week post-fertilization human stage                     HsapDv:0000046  normal #> 7  9th week post-fertilization human stage                     HsapDv:0000046  normal #> 8  9th week post-fertilization human stage                     HsapDv:0000046  normal #> 9  9th week post-fertilization human stage                     HsapDv:0000046  normal #> 10 9th week post-fertilization human stage                     HsapDv:0000046  normal #> 11 9th week post-fertilization human stage                     HsapDv:0000046  normal #> 12 9th week post-fertilization human stage                     HsapDv:0000046  normal #>    disease_ontology_term_id  donor_id is_primary_data self_reported_ethnicity #> 1              PATO:0000461 P13_fetus           FALSE                 unknown #> 2              PATO:0000461 P13_fetus           FALSE                 unknown #> 3              PATO:0000461 P13_fetus           FALSE                 unknown #> 4              PATO:0000461 P13_fetus           FALSE                 unknown #> 5              PATO:0000461 P13_fetus           FALSE                 unknown #> 6              PATO:0000461 P13_fetus           FALSE                 unknown #> 7              PATO:0000461 P13_fetus           FALSE                 unknown #> 8              PATO:0000461 P13_fetus           FALSE                 unknown #> 9              PATO:0000461 P13_fetus           FALSE                 unknown #> 10             PATO:0000461 P13_fetus           FALSE                 unknown #> 11             PATO:0000461 P13_fetus           FALSE                 unknown #> 12             PATO:0000461 P13_fetus           FALSE                 unknown #>    self_reported_ethnicity_ontology_term_id     sex sex_ontology_term_id #> 1                                   unknown unknown              unknown #> 2                                   unknown unknown              unknown #> 3                                   unknown unknown              unknown #> 4                                   unknown unknown              unknown #> 5                                   unknown unknown              unknown #> 6                                   unknown unknown              unknown #> 7                                   unknown unknown              unknown #> 8                                   unknown unknown              unknown #> 9                                   unknown unknown              unknown #> 10                                  unknown unknown              unknown #> 11                                  unknown unknown              unknown #> 12                                  unknown unknown              unknown #>    suspension_type          tissue tissue_ontology_term_id tissue_general #> 1          nucleus decidua basalis          UBERON:0000453       placenta #> 2          nucleus decidua basalis          UBERON:0000453       placenta #> 3          nucleus decidua basalis          UBERON:0000453       placenta #> 4          nucleus decidua basalis          UBERON:0000453       placenta #> 5          nucleus decidua basalis          UBERON:0000453       placenta #> 6          nucleus decidua basalis          UBERON:0000453       placenta #> 7          nucleus decidua basalis          UBERON:0000453       placenta #> 8          nucleus decidua basalis          UBERON:0000453       placenta #> 9          nucleus decidua basalis          UBERON:0000453       placenta #> 10         nucleus decidua basalis          UBERON:0000453       placenta #> 11         nucleus decidua basalis          UBERON:0000453       placenta #> 12         nucleus decidua basalis          UBERON:0000453       placenta #>    tissue_general_ontology_term_id #> 1                   UBERON:0001987 #> 2                   UBERON:0001987 #> 3                   UBERON:0001987 #> 4                   UBERON:0001987 #> 5                   UBERON:0001987 #> 6                   UBERON:0001987 #> 7                   UBERON:0001987 #> 8                   UBERON:0001987 #> 9                   UBERON:0001987 #> 10                  UBERON:0001987 #> 11                  UBERON:0001987 #> 12                  UBERON:0001987 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 3251322 rows ] cell_metadata_b_cell <- census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(   value_filter = \"cell_type == 'B cell' & tissue_general == 'lung'\",   column_names = \"disease\" )  cell_metadata_b_cell <- as.data.frame(cell_metadata_b_cell$concat())  table(cell_metadata_b_cell) #> disease #> chronic obstructive pulmonary disease                              COVID-19  #>                                  6369                                  2729  #>          hypersensitivity pneumonitis             interstitial lung disease  #>                                    52                                   376  #>                   lung adenocarcinoma             lung large cell carcinoma  #>                                 62351                                  1534  #>              lymphangioleiomyomatosis         non-small cell lung carcinoma  #>                                   133                                 17484  #>   non-specific interstitial pneumonia                                normal  #>                                   231                                 25461  #>                 pleomorphic carcinoma                             pneumonia  #>                                  1210                                    50  #>                   pulmonary emphysema                    pulmonary fibrosis  #>                                  1512                                  6798  #>                 pulmonary sarcoidosis             small cell lung carcinoma  #>                                     6                                   583  #>          squamous cell lung carcinoma  #>                                 11920"},{"path":"/articles/census_query_extract.html","id":"querying-gene-metadata-var","dir":"Articles","previous_headings":"","what":"Querying gene metadata (var)","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"human gene metadata Census located census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$var. Similarly cell metadata, SOMADataFrame thus can also use method read(). mouse gene metadata census$get(\"census_data\")$get(\"mus_musculus\")$ms$get(\"RNA\")$var. Let’s take look metadata available column selection row filtering. exception soma_joinid columns defined Census schema. Similarly cell metadata, can use operations learn fetch gene metadata. example, get feature_name feature_length genes \"ENSG00000161798\" \"ENSG00000188229\" can following.","code":"census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$var$colnames() #> [1] \"soma_joinid\"    \"feature_id\"     \"feature_name\"   \"feature_length\" var_df <- census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$var$read(   value_filter = \"feature_id %in% c('ENSG00000161798', 'ENSG00000188229')\",   column_names = c(\"feature_name\", \"feature_length\") )  as.data.frame(var_df$concat()) #>   feature_name feature_length #> 1         AQP5           1884 #> 2       TUBB4B           2037"},{"path":"/articles/census_query_extract.html","id":"querying-expression-data-as-seurat","dir":"Articles","previous_headings":"","what":"Querying expression data as Seurat","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"convenient way query fetch expression data use get_seurat method cellxgene.census API. method combines column selection value filtering described obtain slices expression data based metadata queries. method return Seurat object, takes input census object, string organism, cell gene metadata can specify filters column selection described following arguments: obs_column_names — character vector indicating columns select cell metadata. obs_value_filter — expression selection conditions fetch cells meeting criteria. var_column_names — character vector indicating columns select gene metadata. var_value_filter — expression selection conditions fetch genes meeting criteria. example want fetch expression data : Genes \"ENSG00000161798\" \"ENSG00000188229\". \"B cells\" \"lung\" \"COVID-19\". gene metadata adding sex cell metadata. full description refer ?cellxgene.census::get_seurat.","code":"library(\"Seurat\")  seurat_obj <- get_seurat(   census, \"Homo sapiens\",   obs_column_names = c(\"cell_type\", \"tissue_general\", \"disease\", \"sex\"),   var_value_filter = \"feature_id %in% c('ENSG00000161798', 'ENSG00000188229')\",   obs_value_filter = \"cell_type == 'B cell' & tissue_general == 'lung' & disease == 'COVID-19'\" ) seurat_obj #> An object of class Seurat  #> 2 features across 2729 samples within 1 assay  #> Active assay: RNA (2 features, 0 variable features) #>  2 layers present: counts, data head(seurat_obj[[]]) #>                orig.ident nCount_RNA nFeature_RNA cell_type tissue_general  disease #> cell5946018 SeuratProject          0            0    B cell           lung COVID-19 #> cell5948526 SeuratProject          1            1    B cell           lung COVID-19 #> cell5949180 SeuratProject          0            0    B cell           lung COVID-19 #> cell5949686 SeuratProject          0            0    B cell           lung COVID-19 #> cell5950730 SeuratProject          0            0    B cell           lung COVID-19 #> cell5952197 SeuratProject          0            0    B cell           lung COVID-19 #>                 sex #> cell5946018    male #> cell5948526 unknown #> cell5949180    male #> cell5949686 unknown #> cell5950730    male #> cell5952197 unknown head(seurat_obj$RNA[[]]) #>                 feature_name feature_length #> ENSG00000161798         AQP5           1884 #> ENSG00000188229       TUBB4B           2037"},{"path":"/articles/census_query_extract.html","id":"querying-expression-data-as-singlecellexperiment","dir":"Articles","previous_headings":"","what":"Querying expression data as SingleCellExperiment","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"Similarly previous section, get_single_cell_experiment method cellxgene.census API. behaves exactly get_seurat returns SingleCellExperiment object. example, repeat query can simply following. full description refer ?cellxgene.census::get_single_cell_experiment.","code":"library(\"SingleCellExperiment\")  sce_obj <- get_single_cell_experiment(   census, \"Homo sapiens\",   obs_column_names = c(\"cell_type\", \"tissue_general\", \"disease\", \"sex\"),   var_value_filter = \"feature_id %in% c('ENSG00000161798', 'ENSG00000188229')\",   obs_value_filter = \"cell_type == 'B cell' & tissue_general == 'lung' & disease == 'COVID-19'\" ) sce_obj #> class: SingleCellExperiment  #> dim: 2 2729  #> metadata(0): #> assays(1): counts #> rownames(2): ENSG00000161798 ENSG00000188229 #> rowData names(2): feature_name feature_length #> colnames(2729): obs5946018 obs5948526 ... obs48038140 obs48038164 #> colData names(4): cell_type tissue_general disease sex #> reducedDimNames(0): #> mainExpName: RNA #> altExpNames(0): head(colData(sce_obj)) #> DataFrame with 6 rows and 4 columns #>              cell_type tissue_general     disease         sex #>            <character>    <character> <character> <character> #> obs5946018      B cell           lung    COVID-19        male #> obs5948526      B cell           lung    COVID-19     unknown #> obs5949180      B cell           lung    COVID-19        male #> obs5949686      B cell           lung    COVID-19     unknown #> obs5950730      B cell           lung    COVID-19        male #> obs5952197      B cell           lung    COVID-19     unknown head(rowData(sce_obj)) #> DataFrame with 2 rows and 2 columns #>                 feature_name feature_length #>                  <character>      <integer> #> ENSG00000161798         AQP5           1884 #> ENSG00000188229       TUBB4B           2037"},{"path":"/articles/census_query_extract.html","id":"close-the-census","dir":"Articles","previous_headings":"Querying expression data as SingleCellExperiment","what":"Close the census","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"use, census object closed release memory resources. also closes SOMA objects accessed via top-level census. Closing can automated using .exit(census$close(), add = TRUE) immediately census <- open_soma().","code":"census$close()"},{"path":"/articles/comp_bio_census_info.html","id":"opening-the-census","dir":"Articles","previous_headings":"","what":"Opening the Census","title":"Learning about the CZ CELLxGENE Census","text":"cellxgene.census R package contains convenient open_soma() API open version Census (stable default). can learn cellxgene.census methods accessing corresponding documentation, example ?cellxgene.census::open_soma.","code":"library(\"cellxgene.census\") census <- open_soma()"},{"path":"/articles/comp_bio_census_info.html","id":"census-organization","dir":"Articles","previous_headings":"","what":"Census organization","title":"Learning about the CZ CELLxGENE Census","text":"Census schema defines structure Census. short, can think Census structured collection items stores different pieces information. items parent collection SOMA objects various types can accessed TileDB-SOMA API (documentation). cellxgene.census package contains convenient wrappers TileDB-SOMA API. example function used open Census: cellxgene_census.open_soma().","code":""},{"path":"/articles/comp_bio_census_info.html","id":"main-census-components","dir":"Articles","previous_headings":"Census organization","what":"Main Census components","title":"Learning about the CZ CELLxGENE Census","text":"command created census, SOMACollection, R6 class providing key-value associative map. get() method can access two top-level collection members, census_info census_data, instances SOMACollection.","code":""},{"path":"/articles/comp_bio_census_info.html","id":"census-summary-info","dir":"Articles","previous_headings":"Census organization","what":"Census summary info","title":"Learning about the CZ CELLxGENE Census","text":"census$get(\"census_info\")$get(\"summary\"): data frame high-level information Census, e.g. build date, total cell count, etc. census$get(\"census_info\")$get(\"datasets\"): data frame datasets CELLxGENE Discover used create Census. census$get(\"census_info\")$get(\"summary_cell_counts\"): data frame cell counts stratified relevant cell metadata Census data Data organism stored independent SOMAExperiment objects specialized form SOMACollection. store data matrix (cell genes), cell metadata, gene metadata, useful components covered notebook. data organized one organism – Homo sapiens: census$get(\"census_data\")$get(\"homo_sapiens\")$obs: Cell metadata census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\"): Data matrices, currently … census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$X$get(\"raw\"): matrix raw counts SOMASparseNDArray census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$var: Gene Metadata","code":""},{"path":"/articles/comp_bio_census_info.html","id":"cell-metadata","dir":"Articles","previous_headings":"","what":"Cell metadata","title":"Learning about the CZ CELLxGENE Census","text":"can obtain cell metadata variables directly querying columns corresponding SOMADataFrame. variables can used querying Census case want work specific cells. variables defined CELLxGENE dataset schema except following: soma_joinid: SOMA-defined value use join operations. dataset_id: dataset id encoded census$get(\"census_info\")$get(\"datasets\"). tissue_general tissue_general_ontology_term_id: high-level tissue mapping.","code":"census$get(\"census_data\")$get(\"homo_sapiens\")$obs$colnames() #>  [1] \"soma_joinid\"                              #>  [2] \"dataset_id\"                               #>  [3] \"assay\"                                    #>  [4] \"assay_ontology_term_id\"                   #>  [5] \"cell_type\"                                #>  [6] \"cell_type_ontology_term_id\"               #>  [7] \"development_stage\"                        #>  [8] \"development_stage_ontology_term_id\"       #>  [9] \"disease\"                                  #> [10] \"disease_ontology_term_id\"                 #> [11] \"donor_id\"                                 #> [12] \"is_primary_data\"                          #> [13] \"self_reported_ethnicity\"                  #> [14] \"self_reported_ethnicity_ontology_term_id\" #> [15] \"sex\"                                      #> [16] \"sex_ontology_term_id\"                     #> [17] \"suspension_type\"                          #> [18] \"tissue\"                                   #> [19] \"tissue_ontology_term_id\"                  #> [20] \"tissue_general\"                           #> [21] \"tissue_general_ontology_term_id\""},{"path":"/articles/comp_bio_census_info.html","id":"gene-metadata","dir":"Articles","previous_headings":"","what":"Gene metadata","title":"Learning about the CZ CELLxGENE Census","text":"Similarly, can obtain gene metadata variables directly querying columns corresponding SOMADataFrame. variables can use querying Census case specific genes interested . variables defined CELLxGENE dataset schema except following: soma_joinid: SOMA-defined value use join operations. feature_length: length base pairs gene.","code":"census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$var$colnames() #> [1] \"soma_joinid\"    \"feature_id\"     \"feature_name\"   \"feature_length\""},{"path":"/articles/comp_bio_census_info.html","id":"census-summary-content-tables","dir":"Articles","previous_headings":"","what":"Census summary content tables","title":"Learning about the CZ CELLxGENE Census","text":"can take quick look high-level Census information looking census$get(\"census_info\")$get(\"summary\"): special interest label-value combinations : total_cell_count total number cells Census. unique_cell_count number unique cells, cells may present twice due meta-analysis consortia-like data. number_donors_homo_sapiens number_donors_mus_musculus number individuals human mouse. guaranteed unique one individual ID may present identical different datasets.","code":"as.data.frame(census$get(\"census_info\")$get(\"summary\")$read()$concat()) #>   soma_joinid                      label      value #> 1           0      census_schema_version      1.0.0 #> 2           1          census_build_date 2023-07-25 #> 3           2     dataset_schema_version      3.0.0 #> 4           3           total_cell_count   61656118 #> 5           4          unique_cell_count   37447773 #> 6           5 number_donors_homo_sapiens      13035 #> 7           6 number_donors_mus_musculus       1417"},{"path":"/articles/comp_bio_census_info.html","id":"cell-counts-by-cell-metadata","dir":"Articles","previous_headings":"Census summary content tables","what":"Cell counts by cell metadata","title":"Learning about the CZ CELLxGENE Census","text":"looking census$get(\"census_info)$get(\"summary_cell_counts\") can get general idea cell counts stratified relevant cell metadata. cell metadata included table, can take look cell gene metadata available sections “Cell metadata” “Gene metadata”. line retrieves table casts R data frame: combination organism values category cell metadata can take look total_cell_count unique_cell_count cell counts combination. values category specified ontology_term_id label, value’s IDs labels, respectively.","code":"census_counts <- as.data.frame(census$get(\"census_info\")$get(\"summary_cell_counts\")$read()$concat()) head(census_counts) #>   soma_joinid     organism category ontology_term_id unique_cell_count total_cell_count #> 1           0 Homo sapiens      all               na          33364242         56400873 #> 2           1 Homo sapiens    assay      EFO:0008722            264166           279635 #> 3           2 Homo sapiens    assay      EFO:0008780             25652            51304 #> 4           3 Homo sapiens    assay      EFO:0008919             89477           206754 #> 5           4 Homo sapiens    assay      EFO:0008931             78750           188248 #> 6           5 Homo sapiens    assay      EFO:0008953              4693             9386 #>        label #> 1         na #> 2   Drop-seq #> 3     inDrop #> 4   Seq-Well #> 5 Smart-seq2 #> 6   STRT-seq"},{"path":"/articles/comp_bio_census_info.html","id":"example-cell-metadata-included-in-the-summary-counts-table","dir":"Articles","previous_headings":"Census summary content tables > Cell counts by cell metadata","what":"Example: cell metadata included in the summary counts table","title":"Learning about the CZ CELLxGENE Census","text":"get available cell metadata summary counts table can following. Remember cell metadata available, variables omitted creation table.","code":"t(table(census_counts$organism, census_counts$category)) #>                           #>                           Homo sapiens Mus musculus #>   all                                1            1 #>   assay                             19            9 #>   cell_type                        613          248 #>   disease                           64            5 #>   self_reported_ethnicity           26            1 #>   sex                                3            3 #>   suspension_type                    1            1 #>   tissue                           220           66 #>   tissue_general                    54           27"},{"path":"/articles/comp_bio_census_info.html","id":"example-cell-counts-for-each-sequencing-assay-in-human-data","dir":"Articles","previous_headings":"Census summary content tables > Cell counts by cell metadata","what":"Example: cell counts for each sequencing assay in human data","title":"Learning about the CZ CELLxGENE Census","text":"get cell counts sequencing assay type human data, can perform following operations:","code":"human_assay_counts <- census_counts[census_counts$organism == \"Homo sapiens\" & census_counts$category == \"assay\", ] human_assay_counts <- human_assay_counts[order(human_assay_counts$total_cell_count, decreasing = TRUE), ]"},{"path":"/articles/comp_bio_census_info.html","id":"example-number-of-microglial-cells-in-the-census","dir":"Articles","previous_headings":"Census summary content tables > Cell counts by cell metadata","what":"Example: number of microglial cells in the Census","title":"Learning about the CZ CELLxGENE Census","text":"specific term categories shown can directly find number cells term.","code":"census_counts[census_counts$label == \"microglial cell\", ] #>      soma_joinid     organism  category ontology_term_id unique_cell_count #> 70            69 Homo sapiens cell_type       CL:0000129            268114 #> 1039        1038 Mus musculus cell_type       CL:0000129             48998 #>      total_cell_count           label #> 70             370771 microglial cell #> 1039            62617 microglial cell"},{"path":"/articles/comp_bio_census_info.html","id":"understanding-census-contents-beyond-the-summary-tables","dir":"Articles","previous_headings":"","what":"Understanding Census contents beyond the summary tables","title":"Learning about the CZ CELLxGENE Census","text":"using pre-computed tables census$get(\"census_info\") easy quick way understand contents Census, falls short want learn certain slices Census. example, may want learn : cell types available human liver? total number cells lung datasets stratified sequencing technology? sex distribution cells brain mouse? diseases available T cells? questions can answered directly querying cell metadata shown examples .","code":""},{"path":"/articles/comp_bio_census_info.html","id":"example-all-cell-types-available-in-human","dir":"Articles","previous_headings":"Understanding Census contents beyond the summary tables","what":"Example: all cell types available in human","title":"Learning about the CZ CELLxGENE Census","text":"exemplify process accessing slicing cell metadata summary stats, let’s start trivial example take look human cell types available Census: number rows total number cells humans. Now, wish get cell counts per cell type can work data frame. addition, focus cells marked is_primary_data=TRUE ensures de-duplicate cells appear CELLxGENE Discover. number unique cells. Now let’s look counts per cell type: shows abundant cell types “glutamatergic neuron”, “CD8-positive, alpha-beta T cell”, “CD4-positive, alpha-beta T cell”. Now let’s take look number unique cell types: total number different cell types human. information example can quickly obtained summary table census$get(\"census-info\")$get(\"summary_cell_counts\"). examples complex can achieved accessing cell metadata.","code":"obs_df <-   census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(column_names = c(\"cell_type\", \"is_primary_data\")) as.data.frame(obs_df$concat()) #>                         cell_type is_primary_data #> 1        syncytiotrophoblast cell           FALSE #> 2   placental villous trophoblast           FALSE #> 3        syncytiotrophoblast cell           FALSE #> 4        syncytiotrophoblast cell           FALSE #> 5        extravillous trophoblast           FALSE #> 6   placental villous trophoblast           FALSE #> 7        syncytiotrophoblast cell           FALSE #> 8        extravillous trophoblast           FALSE #> 9   placental villous trophoblast           FALSE #> 10       syncytiotrophoblast cell           FALSE #> 11       syncytiotrophoblast cell           FALSE #> 12       syncytiotrophoblast cell           FALSE #> 13  placental villous trophoblast           FALSE #> 14  placental villous trophoblast           FALSE #> 15       syncytiotrophoblast cell           FALSE #> 16       syncytiotrophoblast cell           FALSE #> 17       syncytiotrophoblast cell           FALSE #> 18       syncytiotrophoblast cell           FALSE #> 19       syncytiotrophoblast cell           FALSE #> 20       extravillous trophoblast           FALSE #> 21       syncytiotrophoblast cell           FALSE #> 22       syncytiotrophoblast cell           FALSE #> 23  placental villous trophoblast           FALSE #> 24       syncytiotrophoblast cell           FALSE #> 25       syncytiotrophoblast cell           FALSE #> 26       syncytiotrophoblast cell           FALSE #> 27       syncytiotrophoblast cell           FALSE #> 28       syncytiotrophoblast cell           FALSE #> 29       syncytiotrophoblast cell           FALSE #> 30       syncytiotrophoblast cell           FALSE #> 31  placental villous trophoblast           FALSE #> 32         trophoblast giant cell           FALSE #> 33       syncytiotrophoblast cell           FALSE #> 34  placental villous trophoblast           FALSE #> 35       syncytiotrophoblast cell           FALSE #> 36       extravillous trophoblast           FALSE #> 37  placental villous trophoblast           FALSE #> 38  placental villous trophoblast           FALSE #> 39       syncytiotrophoblast cell           FALSE #> 40       syncytiotrophoblast cell           FALSE #> 41       syncytiotrophoblast cell           FALSE #> 42       syncytiotrophoblast cell           FALSE #> 43       syncytiotrophoblast cell           FALSE #> 44  placental villous trophoblast           FALSE #> 45  placental villous trophoblast           FALSE #> 46       syncytiotrophoblast cell           FALSE #> 47  placental villous trophoblast           FALSE #> 48       syncytiotrophoblast cell           FALSE #> 49       syncytiotrophoblast cell           FALSE #> 50       syncytiotrophoblast cell           FALSE #> 51       syncytiotrophoblast cell           FALSE #> 52       syncytiotrophoblast cell           FALSE #> 53       syncytiotrophoblast cell           FALSE #> 54       syncytiotrophoblast cell           FALSE #> 55  placental villous trophoblast           FALSE #> 56  placental villous trophoblast           FALSE #> 57  placental villous trophoblast           FALSE #> 58       syncytiotrophoblast cell           FALSE #> 59       syncytiotrophoblast cell           FALSE #> 60       extravillous trophoblast           FALSE #> 61  placental villous trophoblast           FALSE #> 62       extravillous trophoblast           FALSE #> 63       syncytiotrophoblast cell           FALSE #> 64       syncytiotrophoblast cell           FALSE #> 65       syncytiotrophoblast cell           FALSE #> 66  placental villous trophoblast           FALSE #> 67       syncytiotrophoblast cell           FALSE #> 68  placental villous trophoblast           FALSE #> 69       syncytiotrophoblast cell           FALSE #> 70       syncytiotrophoblast cell           FALSE #> 71       syncytiotrophoblast cell           FALSE #> 72       syncytiotrophoblast cell           FALSE #> 73  placental villous trophoblast           FALSE #> 74  placental villous trophoblast           FALSE #> 75  placental villous trophoblast           FALSE #> 76  placental villous trophoblast           FALSE #> 77       syncytiotrophoblast cell           FALSE #> 78       syncytiotrophoblast cell           FALSE #> 79       syncytiotrophoblast cell           FALSE #> 80  placental villous trophoblast           FALSE #> 81       syncytiotrophoblast cell           FALSE #> 82       syncytiotrophoblast cell           FALSE #> 83       syncytiotrophoblast cell           FALSE #> 84  placental villous trophoblast           FALSE #> 85       extravillous trophoblast           FALSE #> 86       syncytiotrophoblast cell           FALSE #> 87       syncytiotrophoblast cell           FALSE #> 88  placental villous trophoblast           FALSE #> 89  placental villous trophoblast           FALSE #> 90       syncytiotrophoblast cell           FALSE #> 91       extravillous trophoblast           FALSE #> 92  placental villous trophoblast           FALSE #> 93       syncytiotrophoblast cell           FALSE #> 94       syncytiotrophoblast cell           FALSE #> 95       syncytiotrophoblast cell           FALSE #> 96       extravillous trophoblast           FALSE #> 97       syncytiotrophoblast cell           FALSE #> 98  placental villous trophoblast           FALSE #> 99  placental villous trophoblast           FALSE #> 100      extravillous trophoblast           FALSE #> 101 placental villous trophoblast           FALSE #> 102      syncytiotrophoblast cell           FALSE #> 103      syncytiotrophoblast cell           FALSE #> 104      extravillous trophoblast           FALSE #> 105 placental villous trophoblast           FALSE #> 106 placental villous trophoblast           FALSE #> 107 placental villous trophoblast           FALSE #> 108 placental villous trophoblast           FALSE #> 109      syncytiotrophoblast cell           FALSE #> 110 placental villous trophoblast           FALSE #> 111 placental villous trophoblast           FALSE #> 112      extravillous trophoblast           FALSE #> 113      extravillous trophoblast           FALSE #> 114      syncytiotrophoblast cell           FALSE #> 115 placental villous trophoblast           FALSE #> 116      extravillous trophoblast           FALSE #> 117 placental villous trophoblast           FALSE #> 118 placental villous trophoblast           FALSE #> 119      syncytiotrophoblast cell           FALSE #> 120      syncytiotrophoblast cell           FALSE #> 121      syncytiotrophoblast cell           FALSE #> 122      syncytiotrophoblast cell           FALSE #> 123      syncytiotrophoblast cell           FALSE #> 124 placental villous trophoblast           FALSE #> 125 placental villous trophoblast           FALSE #> 126 placental villous trophoblast           FALSE #> 127      extravillous trophoblast           FALSE #> 128      extravillous trophoblast           FALSE #>  [ reached 'max' / getOption(\"max.print\") -- omitted 56400745 rows ] obs_df <- census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(   column_names = \"cell_type\",   value_filter = \"is_primary_data == TRUE\" )  obs_df <- as.data.frame(obs_df$concat()) nrow(obs_df) #> [1] 33364242 human_cell_type_counts <- table(obs_df$cell_type) sort(human_cell_type_counts, decreasing = TRUE)[1:10] #>  #>                          neuron            glutamatergic neuron  #>                         2673669                         1541605  #> CD4-positive, alpha-beta T cell CD8-positive, alpha-beta T cell  #>                         1258976                         1235987  #>              classical monocyte                          B cell  #>                         1030996                          908651  #>                     native cell             natural killer cell  #>                          889262                          768755  #>                      macrophage                 oligodendrocyte  #>                          721687                          710242 length(human_cell_type_counts) #> [1] 599"},{"path":"/articles/comp_bio_census_info.html","id":"example-cell-types-available-in-human-liver","dir":"Articles","previous_headings":"Understanding Census contents beyond the summary tables","what":"Example: cell types available in human liver","title":"Learning about the CZ CELLxGENE Census","text":"Similar example , can learn cell types available specific tissue, e.g. liver. achieve goal just need limit cell metadata tissue. use information cell metadata variable tissue_general. variable contains high-level tissue label cells Census: cell types cell counts human liver.","code":"obs_liver_df <- census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(   column_names = \"cell_type\",   value_filter = \"is_primary_data == TRUE & tissue_general == 'liver'\" )  obs_liver_df <- as.data.frame(obs_liver_df$concat())  sort(table(obs_liver_df$cell_type), decreasing = TRUE)[1:10] #>  #>                          T cell                     hepatoblast  #>                           85739                           58447  #>                 neoplastic cell                    erythroblast  #>                           52431                           45605  #>                        monocyte                      hepatocyte  #>                           31388                           28309  #>             natural killer cell    periportal region hepatocyte  #>                           26871                           23509  #>                      macrophage centrilobular region hepatocyte  #>                           16707                           15819"},{"path":"/articles/comp_bio_census_info.html","id":"example-diseased-t-cells-in-human-tissues","dir":"Articles","previous_headings":"Understanding Census contents beyond the summary tables","what":"Example: diseased T cells in human tissues","title":"Learning about the CZ CELLxGENE Census","text":"example going get counts diseased cells annotated T cells. sake example focus “CD8-positive, alpha-beta T cell” “CD4-positive, alpha-beta T cell”: cell counts annotated indicated disease across human tissues “CD8-positive, alpha-beta T cell” “CD4-positive, alpha-beta T cell”.","code":"obs_t_cells_df <- census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(   column_names = c(\"disease\", \"tissue_general\"),   value_filter = \"is_primary_data == TRUE & disease != 'normal' & cell_type %in% c('CD8-positive, alpha-beta T cell', 'CD4-positive, alpha-beta T cell')\" )  obs_t_cells_df <- as.data.frame(obs_t_cells_df$concat())  print(table(obs_t_cells_df)) #>                                        tissue_general #> disease                                 adipose tissue adrenal gland  blood blood clot #>   B-cell non-Hodgkin lymphoma                        0             0  62499          0 #>   breast cancer                                      0             0      0          0 #>   chronic obstructive pulmonary disease              0             0      0          0 #>   chronic rhinitis                                   0             0      0          0 #>   clear cell renal carcinoma                         0             0   6548          0 #>   COVID-19                                           0             0 819428          0 #>   Crohn disease                                      0             0      0          0 #>   cystic fibrosis                                    0             0      0          0 #>   Down syndrome                                      0             0      0          0 #>   follicular lymphoma                                0             0      0          0 #>   influenza                                          0             0   8871          0 #>   interstitial lung disease                          0             0      0          0 #>   kidney benign neoplasm                             0             0     20          0 #>   kidney oncocytoma                                  0             0     16          0 #>   lung adenocarcinoma                                0           205      0          0 #>                                        tissue_general #> disease                                 bone marrow  brain breast  colon kidney  liver #>   B-cell non-Hodgkin lymphoma                     0      0      0      0      0      0 #>   breast cancer                                   0      0   1850      0      0      0 #>   chronic obstructive pulmonary disease           0      0      0      0      0      0 #>   chronic rhinitis                                0      0      0      0      0      0 #>   clear cell renal carcinoma                      0      0      0      0  20540      0 #>   COVID-19                                        0      0      0      0      0      0 #>   Crohn disease                                   0      0      0  17490      0      0 #>   cystic fibrosis                                 0      0      0      0      0      0 #>   Down syndrome                                 181      0      0      0      0      0 #>   follicular lymphoma                             0      0      0      0      0      0 #>   influenza                                       0      0      0      0      0      0 #>   interstitial lung disease                       0      0      0      0      0      0 #>   kidney benign neoplasm                          0      0      0      0     10      0 #>   kidney oncocytoma                               0      0      0      0   2408      0 #>   lung adenocarcinoma                             0   3274      0      0      0    507 #>                                        tissue_general #> disease                                   lung lymph node   nose pleural fluid #>   B-cell non-Hodgkin lymphoma                0          0      0             0 #>   breast cancer                              0          0      0             0 #>   chronic obstructive pulmonary disease   9382          0      0             0 #>   chronic rhinitis                           0          0    909             0 #>   clear cell renal carcinoma                 0         36      0             0 #>   COVID-19                               30578          0     13             0 #>   Crohn disease                              0          0      0             0 #>   cystic fibrosis                            7          0      0             0 #>   Down syndrome                              0          0      0             0 #>   follicular lymphoma                        0       1089      0             0 #>   influenza                                  0          0      0             0 #>   interstitial lung disease               1803          0      0             0 #>   kidney benign neoplasm                     0          0      0             0 #>   kidney oncocytoma                          0          0      0             0 #>   lung adenocarcinoma                   215013      24969      0         11558 #>                                        tissue_general #> disease                                 respiratory system saliva small intestine #>   B-cell non-Hodgkin lymphoma                            0      0               0 #>   breast cancer                                          0      0               0 #>   chronic obstructive pulmonary disease                  0      0               0 #>   chronic rhinitis                                       0      0               0 #>   clear cell renal carcinoma                             0      0               0 #>   COVID-19                                               4     41               0 #>   Crohn disease                                          0      0           52029 #>   cystic fibrosis                                        0      0               0 #>   Down syndrome                                          0      0               0 #>   follicular lymphoma                                    0      0               0 #>   influenza                                              0      0               0 #>   interstitial lung disease                              0      0               0 #>   kidney benign neoplasm                                 0      0               0 #>   kidney oncocytoma                                      0      0               0 #>   lung adenocarcinoma                                    0      0               0 #>  [ reached getOption(\"max.print\") -- omitted 10 rows ]"},{"path":"/articles/comp_bio_data_integration.html","id":"finding-and-fetching-data-from-mouse-liver-10x-genomics-and-smart-seq2","dir":"Articles","previous_headings":"","what":"Finding and fetching data from mouse liver (10X Genomics and Smart-Seq2)","title":"Integrating multi-dataset slices of data with Seurat","text":"Let’s load packages needed notebook. Now can open Census. notebook use Tabula Muris Senis data liver contains cells 10X Genomics Smart-Seq2 technologies. Let’s query datasets table Census filtering collection_name “Tabula Muris Senis” dataset_title “liver”. Now can use values dataset_id query load Seurat object cells datasets. can check cell counts 10X Genomics Smart-Seq2 data looking assay metadata.","code":"library(\"cellxgene.census\") library(\"Seurat\") census <- open_soma() census_datasets <- census$get(\"census_info\")$get(\"datasets\") census_datasets <- census_datasets$read(value_filter = \"collection_name == 'Tabula Muris Senis'\") census_datasets <- as.data.frame(census_datasets$concat())  # Print rows with liver data census_datasets[grep(\"Liver\", census_datasets$dataset_title), ] #>    soma_joinid                        collection_id    collection_name #> 14         525 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis #> 35         547 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis #>               collection_doi                           dataset_id #> 14 10.1038/s41586-020-2496-1 4546e757-34d0-4d17-be06-538318925fcd #> 35 10.1038/s41586-020-2496-1 6202a243-b713-4e12-9ced-c387f8483dea #>                                                                                        dataset_title #> 14 Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - Smart-seq2 #> 35        Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - 10x #>                            dataset_h5ad_path dataset_total_cell_count #> 14 4546e757-34d0-4d17-be06-538318925fcd.h5ad                     2859 #> 35 6202a243-b713-4e12-9ced-c387f8483dea.h5ad                     7294 tabula_muris_liver_ids <- c(\"4546e757-34d0-4d17-be06-538318925fcd\", \"6202a243-b713-4e12-9ced-c387f8483dea\")  seurat_obj <- get_seurat(   census,   organism = \"Mus musculus\",   obs_value_filter = \"dataset_id %in% tabula_muris_liver_ids\" ) table(seurat_obj$assay) #>  #>  10x 3' v2 Smart-seq2  #>       7294       2859"},{"path":"/articles/comp_bio_data_integration.html","id":"gene-length-normalization-of-smart-seq2-data-","dir":"Articles","previous_headings":"","what":"Gene-length normalization of Smart-Seq2 data.","title":"Integrating multi-dataset slices of data with Seurat","text":"Smart-seq2 read counts normalized gene length. Lets first get gene lengths var.feature_length. Now can use normalize Smart-seq data. let’s split object assay. normalize Smart-seq slice using gene lengths merge back single object.","code":"smart_seq_gene_lengths <- seurat_obj$RNA[[]]$feature_length seurat_obj.list <- SplitObject(seurat_obj, split.by = \"assay\") seurat_obj.list[[\"Smart-seq2\"]][[\"RNA\"]]@counts <- seurat_obj.list[[\"Smart-seq2\"]][[\"RNA\"]]@counts / smart_seq_gene_lengths seurat_obj <- merge(seurat_obj.list[[1]], seurat_obj.list[[2]])"},{"path":"/articles/comp_bio_data_integration.html","id":"integration-with-seurat","dir":"Articles","previous_headings":"","what":"Integration with Seurat","title":"Integrating multi-dataset slices of data with Seurat","text":"use native integration capabilities Seurat. comprehensive usage best practices Seurat intergation please refer doc site Seurat.","code":""},{"path":"/articles/comp_bio_data_integration.html","id":"inspecting-data-prior-to-integration","dir":"Articles","previous_headings":"Integration with Seurat","what":"Inspecting data prior to integration","title":"Integrating multi-dataset slices of data with Seurat","text":"Let’s take look strength batch effects data. perform embedding visualization via UMAP. Let’s basic data normalization variable gene selection now perform PCA UMAP   can see batch effects strong cells cluster primarily assay cell_type. Properly integrated embedding principle cluster primarily cell_type, assay best randomly distributed.","code":"seurat_obj <- SCTransform(seurat_obj) seurat_obj <- FindVariableFeatures(seurat_obj, selection.method = \"vst\", nfeatures = 2000) seurat_obj <- RunPCA(seurat_obj, features = VariableFeatures(object = seurat_obj)) seurat_obj <- RunUMAP(seurat_obj, dims = 1:30) # By assay p1 <- DimPlot(seurat_obj, reduction = \"umap\", group.by = \"assay\") p1 # By cell type p2 <- DimPlot(seurat_obj, reduction = \"umap\", group.by = \"cell_type\") p2"},{"path":"/articles/comp_bio_data_integration.html","id":"data-integration-with-seurat","dir":"Articles","previous_headings":"Integration with Seurat","what":"Data integration with Seurat","title":"Integrating multi-dataset slices of data with Seurat","text":"Whenever query fetch Census data multiple datasets integration needs performed evidenced batch effects observed. paramaters Seurat used notebook selected model run quickly. best practices integration single-cell data using Seurat please refer documentation page. seurat_d reading article integrated cell atlas human lung health disease Sikkema et al. perfomed integration 43 datasets Lung. focus metadata Census can batch information integration.","code":""},{"path":"/articles/comp_bio_data_integration.html","id":"integration-across-datasets-using-dataset_id","dir":"Articles","previous_headings":"Integration with Seurat > Data integration with Seurat","what":"Integration across datasets using dataset_id","title":"Integrating multi-dataset slices of data with Seurat","text":"cells Census annotated dataset come \"dataset_id\". great place start integration. let’s run Seurat integration pipeline. First define model batch set dataset_id. Firs normalize select variable genes seperated batch key dataset_id Now perform integration. Let’s inspect results normalization UMAP visulization. plot UMAP.   Great! can see clustering longer mainly driven assay, albeit still contributing . Great! can see clustering longer mainly driven assay, albeit still contributing .","code":"# split the dataset into a list of two seurat objects for each dataset seurat_obj.list <- SplitObject(seurat_obj, split.by = \"dataset_id\")  # normalize each dataset independently seurat_obj.list <- lapply(X = seurat_obj.list, FUN = function(x) {   x <- SCTransform(x) })  # select features for integration features <- SelectIntegrationFeatures(object.list = seurat_obj.list) seurat_obj.list <- PrepSCTIntegration(seurat_obj.list, anchor.features = features) seurat_obj.anchors <- FindIntegrationAnchors(object.list = seurat_obj.list, anchor.features = features, normalization.method = \"SCT\") seurat_obj.combined <- IntegrateData(anchorset = seurat_obj.anchors, normalization.method = \"SCT\") DefaultAssay(seurat_obj.combined) <- \"integrated\"  # Run the standard workflow for visualization and clustering seurat_obj.combined <- ScaleData(seurat_obj.combined, verbose = FALSE) seurat_obj.combined <- RunPCA(seurat_obj.combined, npcs = 30, verbose = FALSE) seurat_obj.combined <- RunUMAP(seurat_obj.combined, reduction = \"pca\", dims = 1:30) # By assay p1 <- DimPlot(seurat_obj.combined, reduction = \"umap\", group.by = \"assay\") p1 # By cell type p2 <- DimPlot(seurat_obj.combined, reduction = \"umap\", group.by = \"cell_type\") p2"},{"path":"/articles/comp_bio_data_integration.html","id":"integration-across-datasets-using-dataset_id-and-controlling-for-batch-using-donor_id","dir":"Articles","previous_headings":"Integration with Seurat > Data integration with Seurat","what":"Integration across datasets using dataset_id and controlling for batch using donor_id","title":"Integrating multi-dataset slices of data with Seurat","text":"Similar dataset_id, cells Census annotated donor_id. definition donor_id depends dataset left discretion data curators. However still rich information can used batch variable integration. donor_id guaranteed unique across cells Census, strongly recommend concatenating dataset_id donor_id use batch separator Seurat Now perform integration. inspect new results UMAP. Plot UMAP.   can see using dataset_id donor_id batch cells now mostly cluster cell type.","code":"# split the dataset into a list of two seurat objects for each dataset seurat_obj.list <- SplitObject(seurat_obj, split.by = \"dataset_id\")  # normalize each dataset independently controlling for batch seurat_obj.list <- lapply(X = seurat_obj.list, FUN = function(x) {   x <- SCTransform(x, vars.to.regress = \"donor_id\") })  # select features for integration features <- SelectIntegrationFeatures(object.list = seurat_obj.list) seurat_obj.list <- PrepSCTIntegration(seurat_obj.list, anchor.features = features) seurat_obj.anchors <- FindIntegrationAnchors(object.list = seurat_obj.list, anchor.features = features, normalization.method = \"SCT\") #> Finding all pairwise anchors #> Running CCA #> Merging objects #> Finding neighborhoods #> Finding anchors #>  Found 7136 anchors #> Filtering anchors #>  Retained 5048 anchors seurat_obj.combined <- IntegrateData(anchorset = seurat_obj.anchors, normalization.method = \"SCT\") #> [1] 1 #> Warning: Different cells and/or features from existing assay SCT #> [1] 2 #> Warning: Different cells and/or features from existing assay SCT #> Merging dataset 1 into 2 #> Extracting anchors for merged samples #> Finding integration vectors #> Finding integration vector weights #> Integrating data #> Warning: Assay integrated changing from Assay to SCTAssay  #> Warning: Different cells and/or features from existing assay SCT DefaultAssay(seurat_obj.combined) <- \"integrated\"  # Run the standard workflow for visualization and clustering seurat_obj.combined <- RunPCA(seurat_obj.combined, npcs = 30, verbose = FALSE) seurat_obj.combined <- RunUMAP(seurat_obj.combined, reduction = \"pca\", dims = 1:30) #> 10:16:53 UMAP embedding parameters a = 0.9922 b = 1.112 #> 10:16:53 Read 10153 rows and found 30 numeric columns #> 10:16:53 Using Annoy for neighbor search, n_neighbors = 30 #> 10:16:53 Building Annoy index with metric = cosine, n_trees = 50 #> 0%   10   20   30   40   50   60   70   80   90   100% #> [----|----|----|----|----|----|----|----|----|----| #> **************************************************| #> 10:16:55 Writing NN index file to temp file /tmp/RtmpzP59ex/file8ed3ae2ddbc #> 10:16:55 Searching Annoy index using 1 thread, search_k = 3000 #> 10:16:58 Annoy recall = 100% #> 10:16:59 Commencing smooth kNN distance calibration using 1 thread with target n_neighbors = 30 #> 10:16:59 Initializing from normalized Laplacian + noise (using RSpectra) #> 10:17:00 Commencing optimization for 200 epochs, with 409718 positive edges #> 10:17:04 Optimization finished # By assay p1 <- DimPlot(seurat_obj.combined, reduction = \"umap\", group.by = \"assay\") p1 # By cell type p2 <- DimPlot(seurat_obj.combined, reduction = \"umap\", group.by = \"cell_type\") p2"},{"path":"/articles/comp_bio_data_integration.html","id":"integration-across-datasets-using-dataset_id-and-controlling-for-batch-using-donor_id-assay_ontology_term_id-suspension_type-","dir":"Articles","previous_headings":"Integration with Seurat > Data integration with Seurat","what":"Integration across datasets using dataset_id and controlling for batch using donor_id + assay_ontology_term_id + suspension_type.","title":"Integrating multi-dataset slices of data with Seurat","text":"cases one dataset may contain multiple assay types /multiple suspension types (cell vs nucleus), important consider metadata batches. Therefore, comprehensive definition batch Census can accomplished combining cell metadata dataset_id, donor_id, assay_ontology_term_id suspension_type, latter encode EFO ids assay types. example, two datasets used contain cells one assay , one suspension type . Thus make difference include metadata part batch. implementation look line","code":"# EXAMPLE, DON'T RUN.  # split the dataset into a list of seurat objects for each dataset seurat_obj.list <- SplitObject(seurat_obj, split.by = \"dataset_id\")  # normalize each dataset independently controlling for batch seurat_obj.list <- lapply(X = seurat_obj.list, FUN = function(x) {   x <- SCTransform(x, vars.to.regress = c(\"donor_id\", \"assay_ontology_term_id\", \"suspension_type\")) })  # select features for integration features <- SelectIntegrationFeatures(object.list = seurat_obj.list)  # integrate seurat_obj.list <- PrepSCTIntegration(seurat_obj.list, anchor.features = features) seurat_obj.anchors <- FindIntegrationAnchors(object.list = seurat_obj.list, anchor.features = features, normalization.method = \"SCT\") seurat_obj.combined <- IntegrateData(anchorset = seurat_obj.anchors, normalization.method = \"SCT\")"},{"path":"/articles/comp_bio_normalizing_full_gene_sequencing.html","id":"opening-the-census","dir":"Articles","previous_headings":"","what":"Opening the census","title":"Normalizing full-length gene sequencing data","text":"First open Census: can learn cellxgene.census methods accessing corresponding documentation, example ?cellxgene.census::open_soma.","code":"library(\"Seurat\") census <- cellxgene.census::open_soma()"},{"path":"/articles/comp_bio_normalizing_full_gene_sequencing.html","id":"fetching-full-length-example-sequencing-data-smart-seq","dir":"Articles","previous_headings":"","what":"Fetching full-length example sequencing data (Smart-Seq)","title":"Normalizing full-length gene sequencing data","text":"Let’s get example data, case ’ll fetch cells relatively small dataset derived Smart-Seq2 technology performs full-length gene sequencing: Collection: Tabula Muris Senis Dataset: Liver - single-cell transcriptomic atlas characterizes ageing tissues mouse - Smart-seq2 Let’s first find dataset’s id using dataset table Census. Now can use id fetch data. Let’s make sure data contains Smart-Seq2 cells. Great! can see small dataset containing 2,859 cells. Now let’s proceed normalize gene lengths.","code":"liver_dataset <- as.data.frame(   census$get(\"census_info\")$get(\"datasets\")         $read(value_filter=\"dataset_title == 'Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - Smart-seq2'\")         $concat() ) liver_dataset #>   soma_joinid                        collection_id    collection_name #> 1         525 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis #>              collection_doi                           dataset_id #> 1 10.1038/s41586-020-2496-1 4546e757-34d0-4d17-be06-538318925fcd #>                                                                                       dataset_title #> 1 Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - Smart-seq2 #>                           dataset_h5ad_path dataset_total_cell_count #> 1 4546e757-34d0-4d17-be06-538318925fcd.h5ad                     2859 liver_dataset_id <- liver_dataset[1,\"dataset_id\"] liver_seurat <- cellxgene.census::get_seurat(   census,   organism = \"Mus musculus\",   obs_value_filter = paste0(\"dataset_id == '\", liver_dataset_id, \"'\") ) table(liver_seurat$assay) #>  #> Smart-seq2  #>       2859"},{"path":"/articles/comp_bio_normalizing_full_gene_sequencing.html","id":"normalizing-expression-to-account-for-gene-length","dir":"Articles","previous_headings":"","what":"Normalizing expression to account for gene length","title":"Normalizing full-length gene sequencing data","text":"default cellxgene_census::get_seurat() fetches genes Census. let’s first identify genes measured dataset subset Seurat obect include . goal can use “Dataset Presence Matrix” census$get(\"census_data\")$get(\"mus_musculus\")$ms$get(\"RNA\")$get(\"feature_dataset_presence_matrix\"). boolean matrix N x M N number datasets, M number genes Census, 1 entry indicates gene measured dataset. (Note Seurat objects transposed layout M x N.) Let’s get genes measured dataset. can see genes Census 17,992 measured dataset. Now let’s normalize genes gene length. can easily Census gene lengths included gene metadata feature_length. done! can now see real numbers instead integers.","code":"liver_seurat #> An object of class Seurat  #> 52392 features across 2859 samples within 1 assay  #> Active assay: RNA (52392 features, 0 variable features) #>  2 layers present: counts, data liver_dataset_joinid <- liver_dataset$soma_joinid[1] presence_matrix <- cellxgene.census::get_presence_matrix(census, \"Mus musculus\", \"RNA\") presence_matrix <- presence_matrix$take(liver_dataset_joinid) gene_presence <- as.vector(presence_matrix$get_one_based_matrix())  liver_seurat <- liver_seurat[gene_presence, ] liver_seurat #> An object of class Seurat  #> 17992 features across 2859 samples within 1 assay  #> Active assay: RNA (17992 features, 0 variable features) #>  2 layers present: counts, data GetAssayData(liver_seurat[1:5, 1:5], slot = \"data\") #> Warning: The `slot` argument of `GetAssayData()` is deprecated as of SeuratObject 5.0.0. #> ℹ Please use the `layer` argument instead. #> This warning is displayed once every 8 hours. #> Call `lifecycle::last_lifecycle_warnings()` to see where this warning was generated. #> 5 x 5 sparse Matrix of class \"dgCMatrix\" #>                    cell3530079 cell3530080 cell3530081 cell3530082 cell3530083 #> ENSMUSG00000025900           .           .           .           .           . #> ENSMUSG00000025902           .           .           .           .        2250 #> ENSMUSG00000033845           .         559        1969           .           . #> ENSMUSG00000025903           .           .           .           .           . #> ENSMUSG00000033813           .           .         828           1          54 gene_lengths <- liver_seurat$RNA@meta.features$feature_length liver_seurat <- SetAssayData(   liver_seurat,    new.data = sweep(GetAssayData(liver_seurat, slot = \"data\"), 1, gene_lengths, \"/\") ) GetAssayData(liver_seurat[1:5, 1:5], slot = \"data\") #> 5 x 5 sparse Matrix of class \"dgCMatrix\" #>                    cell3530079 cell3530080 cell3530081  cell3530082 cell3530083 #> ENSMUSG00000025900           .  .            .         .             .          #> ENSMUSG00000025902           .  .            .         .             0.47150042 #> ENSMUSG00000033845           .  0.06586544   0.2320019 .             .          #> ENSMUSG00000025903           .  .            .         .             .          #> ENSMUSG00000033813           .  .            0.2744448 0.0003314551  0.01789857"},{"path":"/articles/comp_bio_normalizing_full_gene_sequencing.html","id":"validation-through-clustering-exploration","dir":"Articles","previous_headings":"","what":"Validation through clustering exploration","title":"Normalizing full-length gene sequencing data","text":"Let’s perform basic clustering analysis see cell types cluster expected using normalized counts. First basic filtering cells genes. normalize account sequencing depth transform data log scale. subset highly variable genes. finally scale values across gene axis. Now can proceed clustering analysis.  exceptions can see cells cell type cluster near serves sanity check gene-length normalization applied. Don’t forget close census.","code":"cells_per_gene <- rowSums(GetAssayData(liver_seurat, slot = \"counts\") > 0) genes_per_cell <- Matrix::colSums(liver_seurat$RNA@counts > 0) liver_seurat <- liver_seurat[cells_per_gene >= 5, genes_per_cell >= 500] liver_seurat <- Seurat::NormalizeData(   liver_seurat,   normalization.method = \"LogNormalize\",   scale.factor = 10000 ) liver_seurat <- Seurat::FindVariableFeatures(   liver_seurat,   selection.method = \"vst\",   nfeatures = 1000 ) all.genes <- rownames(liver_seurat) liver_seurat <- Seurat::ScaleData(liver_seurat, features = all.genes) liver_seurat <- RunPCA(   liver_seurat,   features = VariableFeatures(object = liver_seurat) ) liver_seurat <- FindNeighbors(liver_seurat, dims = 1:40) liver_seurat <- RunUMAP(liver_seurat, dims = 1:40) DimPlot(liver_seurat, reduction = \"umap\", group.by = \"cell_type\") census$close()"},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"opening-the-census","dir":"Articles","previous_headings":"","what":"Opening the Census","title":"Summarizing cell and gene metadata","text":"cellxgene.census R package contains convenient API open version Census (default, newest stable version). open Census, close census$close(). can automated using .exit(census$close(), add = TRUE) immediately census <- open_soma(). can learn cellxgene.census methods accessing corresponding documentation. example ?cellxgene.census::open_soma.","code":"library(\"cellxgene.census\") census <- open_soma()"},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"summarizing-cell-metadata","dir":"Articles","previous_headings":"","what":"Summarizing cell metadata","title":"Summarizing cell and gene metadata","text":"Census open can use TileDB-SOMA methods SOMACollection. can thus access metadata SOMADataFrame objects encoding cell gene metadata. Tips: can read entire SOMADataFrame R using .data.frame(soma_df$read()$concat()). Queries much faster request DataFrame columns required analysis (e.g. column_names = c(\"soma_joinid\", \"cell_type_ontology_term_id\")). can also refine query results using value_filter, filter census matching records.","code":""},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"example-summarize-all-cell-types","dir":"Articles","previous_headings":"Summarizing cell metadata","what":"Example: Summarize all cell types","title":"Summarizing cell and gene metadata","text":"example reads cell metadata (obs) R data frame summarize variety ways.","code":"human <- census$get(\"census_data\")$get(\"homo_sapiens\")  # Read obs into an R data frame (tibble). obs_df <- human$obs$read(column_names = c(\"cell_type\")) obs_df <- as.data.frame(obs_df$concat())  # Find all unique values in the cell_type column. unique_cell_type <- unique(obs_df$cell_type)  cat(   \"There are\",   length(unique_cell_type),   \"cell types in the Census! The first few are: \",   paste(head(unique_cell_type), collapse = \", \") ) #> There are 631 cell types in the Census! The first few are:  oligodendrocyte, oligodendrocyte precursor cell, astrocyte of the cerebral cortex, microglial cell, cerebral cortex endothelial cell, vascular leptomeningeal cell"},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"example-summarize-a-subset-of-cell-types-selected-with-a-value_filter","dir":"Articles","previous_headings":"Summarizing cell metadata","what":"Example: Summarize a subset of cell types, selected with a value_filter","title":"Summarizing cell and gene metadata","text":"example utilizes SOMA “value filter” read subset cells tissue_ontology_term_id equal UBERON:0002048 (lung tissue), summarizes query result. can also define much complex value filters. example: combine terms & | use %% operator query multiple values","code":"# Read cell_type terms for cells which have a specific tissue term LUNG_TISSUE <- \"UBERON:0002048\"  obs_df <- human$obs$read(column_names = c(\"cell_type\"), value_filter = paste0(\"tissue_ontology_term_id == '\", LUNG_TISSUE, \"'\")) obs_df <- as.data.frame(obs_df$concat())  # Find all unique values in the cell_type column as an R data frame. unique_cell_type <- unique(obs_df$cell_type) cat(   \"There are \",   length(unique_cell_type),   \" cell types in the Census where tissue_ontology_term_id == \",   LUNG_TISSUE,   \"!\\nThe first few are:\",   paste(head(unique_cell_type), collapse = \", \"),   \"\\n\" ) #> There are  185  cell types in the Census where tissue_ontology_term_id ==  UBERON:0002048 ! #> The first few are: type II pneumocyte, neutrophil, effector CD4-positive, alpha-beta T cell, effector CD8-positive, alpha-beta T cell, mature NK T cell, blood vessel endothelial cell  # Report the 10 most common top_10 <- sort(table(obs_df$cell_type), decreasing = TRUE)[1:10] cat(   \"The top 10 cell types where tissue_ontology_term_id ==\",    LUNG_TISSUE,   \"are: \",   paste(names(top_10), collapse = \", \") ) #> The top 10 cell types where tissue_ontology_term_id == UBERON:0002048 are:  native cell, alveolar macrophage, CD8-positive, alpha-beta T cell, CD4-positive, alpha-beta T cell, macrophage, type II pneumocyte, classical monocyte, natural killer cell, malignant cell, epithelial cell of lower respiratory tract # You can also do more complex queries, such as testing for inclusion in a list of values obs_df <- human$obs$read(   column_names = c(\"cell_type_ontology_term_id\"),   value_filter = \"tissue_ontology_term_id %in% c('UBERON:0002082', 'UBERON:OOO2084', 'UBERON:0002080')\" )  obs_df <- as.data.frame(obs_df$concat())  # Summarize top_10 <- sort(table(obs_df$cell_type_ontology_term_id), decreasing = TRUE)[1:10] print(top_10) #>  #> CL:0000746 CL:0008034 CL:0002131 CL:0002548 CL:0000115 CL:0000763 CL:0000057 CL:0000669  #>     160974      99458      96953      79733      79626      35560      33075      27515  #> CL:0000003 CL:0002144  #>      23613      18593"},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"full-census-metadata-stats","dir":"Articles","previous_headings":"","what":"Full Census metadata stats","title":"Summarizing cell and gene metadata","text":"example queries organisms Census, summarizes diversity various metadata labels.","code":"cols_to_query <- c(   \"cell_type_ontology_term_id\",   \"assay_ontology_term_id\",   \"tissue_ontology_term_id\" )  total_cells <- 0 for (organism in census$get(\"census_data\")$names()) {   print(organism)      obs_df <- census$get(\"census_data\")$get(organism)$obs$read(column_names = cols_to_query)   obs_df <- as.data.frame(obs_df$concat())      total_cells <- total_cells + nrow(obs_df)   for (col in cols_to_query) {     cat(\"  Unique \", col, \" values: \", length(unique(obs_df[[col]])), \"\\n\")   } } #> [1] \"homo_sapiens\" #>   Unique  cell_type_ontology_term_id  values:  631  #>   Unique  assay_ontology_term_id  values:  20  #>   Unique  tissue_ontology_term_id  values:  230  #> [1] \"mus_musculus\" #>   Unique  cell_type_ontology_term_id  values:  248  #>   Unique  assay_ontology_term_id  values:  10  #>   Unique  tissue_ontology_term_id  values:  74 cat(\"Complete Census contains \", total_cells, \" cells.\") #> Complete Census contains  68683222  cells."},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"close-the-census","dir":"Articles","previous_headings":"Full Census metadata stats","what":"Close the census","title":"Summarizing cell and gene metadata","text":"use, census object closed release memory resources. also closes SOMA objects accessed via top-level census. Closing can automated using .exit(census$close(), add = TRUE) immediately census <- open_soma().","code":"census$close()"},{"path":"/authors.html","id":null,"dir":"","previous_headings":"","what":"Authors","title":"Authors and Citation","text":"Chan Zuckerberg Initiative Foundation. Author, maintainer, copyright holder, funder.","code":""},{"path":"/authors.html","id":"citation","dir":"","previous_headings":"","what":"Citation","title":"Authors and Citation","text":"Chan Zuckerberg Initiative Foundation (2023). cellxgene.census: CZ CELLxGENE Discover Cell Census. R package version 1.9.1, https://github.com/chanzuckerberg/cellxgene-census.","code":"@Manual{,   title = {cellxgene.census: CZ CELLxGENE Discover Cell Census},   author = {{Chan Zuckerberg Initiative Foundation}},   year = {2023},   note = {R package version 1.9.1},   url = {https://github.com/chanzuckerberg/cellxgene-census}, }"},{"path":"/index.html","id":"r-package-of-cz-cellxgene-discover-census","dir":"","previous_headings":"","what":"CZ CELLxGENE Discover Cell Census","title":"CZ CELLxGENE Discover Cell Census","text":"documentation R package cellxgene.census part CZ CELLxGENE Discover Census. full details Census data capabilities please go main Census site. cellxgene.census provides API efficiently access cloud-hosted Census single-cell data R. just seconds users can access slice Census data using cell gene filters across hundreds single-cell datasets. Census data can fetched iterative fashion bigger--memory slices data, quickly exported basic R structures, well Seurat SingleCellExperiment objects downstream analysis.","code":""},{"path":"/index.html","id":"installation","dir":"","previous_headings":"","what":"Installation","title":"CZ CELLxGENE Discover Cell Census","text":"installing Ubuntu, may need install following libraries via apt install, libxml2-dev libssl-dev libcurl4-openssl-dev. addition must cmake v3.21 greater. installing MacOS, need install developer tools Xcode. Windows supported. R session install cellxgene.census R-Universe. able export Census data Seurat SingleCellExperiment also need install respective packages.","code":"install.packages(   \"cellxgene.census\",   repos=c('https://chanzuckerberg.r-universe.dev', 'https://cloud.r-project.org') ) # Seurat install.packages(\"Seurat\")  # SingleCellExperiment if (!require(\"BiocManager\", quietly = TRUE))     install.packages(\"BiocManager\")  BiocManager::install(\"SingleCellExperiment\")"},{"path":"/index.html","id":"usage","dir":"","previous_headings":"","what":"Usage","title":"CZ CELLxGENE Discover Cell Census","text":"Check vignettes “Articles” section navigation bar site. highly recommend following vignettes starting point: Querying fetching single-cell data cell/gene metadata Learning CZ CELLxGENE Discover Census can also check quick start guide main Census site.","code":""},{"path":"/index.html","id":"example-seurat-and-singlecellexperiment-query","dir":"","previous_headings":"Usage","what":"Example Seurat and SingleCellExperiment query","title":"CZ CELLxGENE Discover Cell Census","text":"following creates Seurat object -demand sympathetic neurons Census filtering genes ENSG00000161798, ENSG00000188229. following retrieves data SingleCellExperiment object.","code":"library(\"cellxgene.census\") library(\"Seurat\")  census <- open_soma()  organism <- \"Homo sapiens\" gene_filter <- \"feature_id %in% c('ENSG00000107317', 'ENSG00000106034')\" cell_filter <-  \"cell_type == 'sympathetic neuron'\" cell_columns <- c(\"assay\", \"cell_type\", \"tissue\", \"tissue_general\", \"suspension_type\", \"disease\")  seurat_obj <- get_seurat(    census = census,    organism = organism,    var_value_filter = gene_filter,    obs_value_filter = cell_filter,    obs_column_names = cell_columns ) library(\"SingleCellExperiment\")  sce_obj <- get_single_cell_experiment(    census = census,    organism = organism,    var_value_filter = gene_filter,    obs_value_filter = cell_filter,    obs_column_names = cell_columns )"},{"path":"/index.html","id":"for-more-help","dir":"","previous_headings":"","what":"For More Help","title":"CZ CELLxGENE Discover Cell Census","text":"help, please go visit main Census site. believe found security issue, appreciate notification. Please send email security@chanzuckerberg.com.","code":""},{"path":"/reference/download_source_h5ad.html","id":null,"dir":"Reference","previous_headings":"","what":"Download source H5AD to local file name. — download_source_h5ad","title":"Download source H5AD to local file name. — download_source_h5ad","text":"Download source H5AD local file name.","code":""},{"path":"/reference/download_source_h5ad.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Download source H5AD to local file name. — download_source_h5ad","text":"","code":"download_source_h5ad(   dataset_id,   file,   overwrite = FALSE,   census_version = \"stable\",   census = NULL )"},{"path":"/reference/download_source_h5ad.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Download source H5AD to local file name. — download_source_h5ad","text":"dataset_id dataset_id interest. file Local file name store H5AD file. overwrite TRUE allow overwriting existing file. census_version desired Census version. census open Census handle census_version. provided, opened closed automatically; efficient reuse handle calling download_source_h5ad() multiple times.","code":""},{"path":"/reference/download_source_h5ad.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Download source H5AD to local file name. — download_source_h5ad","text":"","code":"download_source_h5ad(\"0895c838-e550-48a3-a777-dbcd35d30272\", \"/tmp/data.h5ad\", overwrite = TRUE)"},{"path":"/reference/get_census_version_description.html","id":null,"dir":"Reference","previous_headings":"","what":"Get release description for a Census version — get_census_version_description","title":"Get release description for a Census version — get_census_version_description","text":"Get release description Census version","code":""},{"path":"/reference/get_census_version_description.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Get release description for a Census version — get_census_version_description","text":"","code":"get_census_version_description(census_version)"},{"path":"/reference/get_census_version_description.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Get release description for a Census version — get_census_version_description","text":"census_version census version name.","code":""},{"path":"/reference/get_census_version_description.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Get release description for a Census version — get_census_version_description","text":"List release location metadata","code":""},{"path":"/reference/get_census_version_description.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Get release description for a Census version — get_census_version_description","text":"","code":"as.data.frame(get_census_version_description(\"stable\")) #>   release_date release_build #> 1                 2023-07-25 #>                                                              soma.uri #> 1 s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/ #>               soma.relative_uri soma.s3_region #> 1 /cell-census/2023-07-25/soma/      us-west-2 #>                                                              h5ads.uri #> 1 s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/h5ads/ #>               h5ads.relative_uri h5ads.s3_region do_not_delete  lts  alias #> 1 /cell-census/2023-07-25/h5ads/       us-west-2          TRUE TRUE stable #>   census_version #> 1         stable"},{"path":"/reference/get_census_version_directory.html","id":null,"dir":"Reference","previous_headings":"","what":"Get the directory of Census releases currently available — get_census_version_directory","title":"Get the directory of Census releases currently available — get_census_version_directory","text":"Get directory Census releases currently available","code":""},{"path":"/reference/get_census_version_directory.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Get the directory of Census releases currently available — get_census_version_directory","text":"","code":"get_census_version_directory()"},{"path":"/reference/get_census_version_directory.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Get the directory of Census releases currently available — get_census_version_directory","text":"Data frame available cell census releases, including location metadata.","code":""},{"path":"/reference/get_census_version_directory.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Get the directory of Census releases currently available — get_census_version_directory","text":"","code":"get_census_version_directory() #>            release_date release_build #> stable                     2023-07-25 #> latest                     2023-12-11 #> 2023-05-15                 2023-05-15 #> 2023-07-25                 2023-07-25 #> 2023-10-23                 2023-10-23 #> 2023-11-13                 2023-11-13 #> 2023-11-20                 2023-11-20 #> 2023-11-27                 2023-11-27 #> 2023-12-11                 2023-12-11 #> 2023-12-15                 2023-12-15 #>                                                                       soma.uri #> stable     s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/ #> latest     s3://cellxgene-census-public-us-west-2/cell-census/2023-12-11/soma/ #> 2023-05-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-05-15/soma/ #> 2023-07-25 s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/ #> 2023-10-23 s3://cellxgene-census-public-us-west-2/cell-census/2023-10-23/soma/ #> 2023-11-13 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-13/soma/ #> 2023-11-20 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-20/soma/ #> 2023-11-27 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-27/soma/ #> 2023-12-11 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-11/soma/ #> 2023-12-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/ #>                        soma.relative_uri soma.s3_region #> stable     /cell-census/2023-07-25/soma/      us-west-2 #> latest     /cell-census/2023-12-11/soma/      us-west-2 #> 2023-05-15 /cell-census/2023-05-15/soma/      us-west-2 #> 2023-07-25 /cell-census/2023-07-25/soma/      us-west-2 #> 2023-10-23 /cell-census/2023-10-23/soma/      us-west-2 #> 2023-11-13 /cell-census/2023-11-13/soma/      us-west-2 #> 2023-11-20 /cell-census/2023-11-20/soma/      us-west-2 #> 2023-11-27 /cell-census/2023-11-27/soma/      us-west-2 #> 2023-12-11 /cell-census/2023-12-11/soma/      us-west-2 #> 2023-12-15 /cell-census/2023-12-15/soma/      us-west-2 #>                                                                       h5ads.uri #> stable     s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/h5ads/ #> latest     s3://cellxgene-census-public-us-west-2/cell-census/2023-12-11/h5ads/ #> 2023-05-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-05-15/h5ads/ #> 2023-07-25 s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/h5ads/ #> 2023-10-23 s3://cellxgene-census-public-us-west-2/cell-census/2023-10-23/h5ads/ #> 2023-11-13 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-13/h5ads/ #> 2023-11-20 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-20/h5ads/ #> 2023-11-27 s3://cellxgene-census-public-us-west-2/cell-census/2023-11-27/h5ads/ #> 2023-12-11 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-11/h5ads/ #> 2023-12-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/h5ads/ #>                        h5ads.relative_uri h5ads.s3_region do_not_delete   lts #> stable     /cell-census/2023-07-25/h5ads/       us-west-2          TRUE  TRUE #> latest     /cell-census/2023-12-11/h5ads/       us-west-2         FALSE    NA #> 2023-05-15 /cell-census/2023-05-15/h5ads/       us-west-2          TRUE  TRUE #> 2023-07-25 /cell-census/2023-07-25/h5ads/       us-west-2          TRUE  TRUE #> 2023-10-23 /cell-census/2023-10-23/h5ads/       us-west-2          TRUE FALSE #> 2023-11-13 /cell-census/2023-11-13/h5ads/       us-west-2         FALSE    NA #> 2023-11-20 /cell-census/2023-11-20/h5ads/       us-west-2         FALSE    NA #> 2023-11-27 /cell-census/2023-11-27/h5ads/       us-west-2         FALSE    NA #> 2023-12-11 /cell-census/2023-12-11/h5ads/       us-west-2         FALSE    NA #> 2023-12-15 /cell-census/2023-12-15/h5ads/       us-west-2          TRUE  TRUE #>             alias #> stable     stable #> latest     latest #> 2023-05-15        #> 2023-07-25        #> 2023-10-23        #> 2023-11-13        #> 2023-11-20        #> 2023-11-27        #> 2023-12-11        #> 2023-12-15"},{"path":"/reference/get_presence_matrix.html","id":null,"dir":"Reference","previous_headings":"","what":"Read the feature dataset presence matrix. — get_presence_matrix","title":"Read the feature dataset presence matrix. — get_presence_matrix","text":"Read feature dataset presence matrix.","code":""},{"path":"/reference/get_presence_matrix.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Read the feature dataset presence matrix. — get_presence_matrix","text":"","code":"get_presence_matrix(census, organism, measurement_name = \"RNA\")"},{"path":"/reference/get_presence_matrix.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Read the feature dataset presence matrix. — get_presence_matrix","text":"census census object cellxgene.census::open_soma(). organism organism query, usually one Homo sapiens Mus musculus measurement_name measurement object query. Defaults RNA.","code":""},{"path":"/reference/get_presence_matrix.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Read the feature dataset presence matrix. — get_presence_matrix","text":"tiledbsoma::matrixZeroBasedView object dataset join id & feature join id dimensions, filled 1s indicating presence. sparse matrix accessed zero-based indexes since join id's may zero.","code":""},{"path":"/reference/get_presence_matrix.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Read the feature dataset presence matrix. — get_presence_matrix","text":"","code":"census <- open_soma() #> The stable Census release is currently 2023-07-25. Specify census_version = \"2023-07-25\" in future calls to open_soma() to ensure data consistency. on.exit(census$close(), add = TRUE) print(get_presence_matrix(census, \"Homo sapiens\")$dim()) #> Error in private$check_open_for_read_or_write(): Item must be open for read or write. s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/"},{"path":"/reference/get_seurat.html","id":null,"dir":"Reference","previous_headings":"","what":"Export Census slices to Seurat — get_seurat","title":"Export Census slices to Seurat — get_seurat","text":"Convenience wrapper around SOMAExperimentAxisQuery, build execute query, return Seurat object.","code":""},{"path":"/reference/get_seurat.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Export Census slices to Seurat — get_seurat","text":"","code":"get_seurat(   census,   organism,   measurement_name = \"RNA\",   X_layers = c(counts = \"raw\", data = NULL),   obs_value_filter = NULL,   obs_coords = NULL,   obs_column_names = NULL,   obsm_layers = FALSE,   var_value_filter = NULL,   var_coords = NULL,   var_column_names = NULL,   var_index = \"feature_id\" )"},{"path":"/reference/get_seurat.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Export Census slices to Seurat — get_seurat","text":"census census object, usually returned cellxgene.census::open_soma(). organism organism query, usually one Homo sapiens Mus musculus measurement_name measurement object query. Defaults RNA. X_layers named character X layers add Seurat assay, names names Seurat slots (counts data) values names layers within X. obs_value_filter SOMA value_filter across columns obs dataframe, expressed string. obs_coords set coordinates obs dataframe index, expressed type format supported SOMADataFrame's read() method. obs_column_names Columns fetch obs data frame. obsm_layers Names arrays obsm add cell embeddings; pass FALSE suppress loading dimensional reductions. var_value_filter obs_value_filter var. var_coords obs_coords var. var_column_names Columns fetch var data frame. var_index Name column ‘var’ add feature names.","code":""},{"path":"/reference/get_seurat.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Export Census slices to Seurat — get_seurat","text":"Seurat object containing sensus slice.","code":""},{"path":"/reference/get_seurat.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Export Census slices to Seurat — get_seurat","text":"","code":"if (FALSE) { census <- open_soma() seurat_obj <- get_seurat(   census,   organism = \"Homo sapiens\",   obs_value_filter = \"cell_type == 'leptomeningeal cell'\",   var_value_filter = \"feature_id %in% c('ENSG00000107317', 'ENSG00000106034')\" )  seurat_obj  census$close() }"},{"path":"/reference/get_single_cell_experiment.html","id":null,"dir":"Reference","previous_headings":"","what":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","title":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","text":"Convenience wrapper around SOMAExperimentAxisQuery, build execute query, return SingleCellExperiment object.","code":""},{"path":"/reference/get_single_cell_experiment.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","text":"","code":"get_single_cell_experiment(   census,   organism,   measurement_name = \"RNA\",   X_layers = c(counts = \"raw\"),   obs_value_filter = NULL,   obs_coords = NULL,   obs_column_names = NULL,   obsm_layers = FALSE,   var_value_filter = NULL,   var_coords = NULL,   var_column_names = NULL,   var_index = \"feature_id\" )"},{"path":"/reference/get_single_cell_experiment.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","text":"census census object, usually returned cellxgene.census::open_soma(). organism organism query, usually one Homo sapiens Mus musculus measurement_name measurement object query. Defaults RNA. X_layers character vector X layers add assays main experiment; may optionally named set name resulting assay (eg. ‘X_layers = c(counts = \"raw\")’ load X layer “‘raw’” assay “‘counts’”); default, loads X layers obs_value_filter SOMA value_filter across columns obs dataframe, expressed string. obs_coords set coordinates obs dataframe index, expressed type format supported SOMADataFrame's read() method. obs_column_names Columns fetch obs data frame. obsm_layers Names arrays obsm add cell embeddings; pass FALSE suppress loading dimensional reductions. var_value_filter obs_value_filter var. var_coords obs_coords var. var_column_names Columns fetch var data frame. var_index Name column ‘var’ add feature names.","code":""},{"path":"/reference/get_single_cell_experiment.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","text":"SingleCellExperiment object containing sensus slice.","code":""},{"path":"/reference/get_single_cell_experiment.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","text":"","code":"if (FALSE) { census <- open_soma() sce_obj <- get_single_cell_experiment(   census,   organism = \"Homo sapiens\",   obs_value_filter = \"cell_type == 'leptomeningeal cell'\",   var_value_filter = \"feature_id %in% c('ENSG00000107317', 'ENSG00000106034')\" )  sce_obj  census$close() }"},{"path":"/reference/get_source_h5ad_uri.html","id":null,"dir":"Reference","previous_headings":"","what":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","title":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","text":"Locate source h5ad file dataset.","code":""},{"path":"/reference/get_source_h5ad_uri.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","text":"","code":"get_source_h5ad_uri(dataset_id, census_version = \"stable\", census = NULL)"},{"path":"/reference/get_source_h5ad_uri.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","text":"dataset_id dataset_id interest. census_version desired Census version. census open Census handle census_version. provided, opened closed automatically; efficient reuse handle calling get_source_h5ad_uri() multiple times.","code":""},{"path":"/reference/get_source_h5ad_uri.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","text":"list uri optional s3_region.","code":""},{"path":"/reference/get_source_h5ad_uri.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","text":"","code":"get_source_h5ad_uri(\"0895c838-e550-48a3-a777-dbcd35d30272\") #> $uri #> [1] \"s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/h5ads/0895c838-e550-48a3-a777-dbcd35d30272.h5ad\" #>  #> $s3_region #> [1] \"us-west-2\" #>"},{"path":"/reference/new_SOMATileDBContext_for_census.html","id":null,"dir":"Reference","previous_headings":"","what":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","title":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","text":"Create SOMATileDBContext suitable using open_soma(). Typically open_soma() creates context automatically, one can created separately order set custom configuration options, share multiple open Census handles.","code":""},{"path":"/reference/new_SOMATileDBContext_for_census.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","text":"","code":"new_SOMATileDBContext_for_census(   census_version_description,   mirror = \"default\",   ... )"},{"path":"/reference/new_SOMATileDBContext_for_census.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","text":"census_version_description result get_census_version_description() desired Census version. mirror name intended census mirror (get_census_mirror_directory()[[name]] save lookup), NULL configure local file access. ... Custom configuration options.","code":""},{"path":"/reference/new_SOMATileDBContext_for_census.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","text":"SOMATileDBContext object open_soma().","code":""},{"path":"/reference/new_SOMATileDBContext_for_census.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","text":"","code":"census_desc <- get_census_version_description(\"stable\") ctx <- new_SOMATileDBContext_for_census(census_desc, \"soma.init_buffer_bytes\" = paste(4 * 1024**3)) census <- open_soma(\"stable\", tiledbsoma_ctx = ctx) #> The stable Census release is currently 2023-07-25. Specify census_version = \"2023-07-25\" in future calls to open_soma() to ensure data consistency. census$close()"},{"path":"/reference/open_soma.html","id":null,"dir":"Reference","previous_headings":"","what":"Open the Census — open_soma","title":"Open the Census — open_soma","text":"Open Census","code":""},{"path":"/reference/open_soma.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Open the Census — open_soma","text":"","code":"open_soma(   census_version = \"stable\",   uri = NULL,   tiledbsoma_ctx = NULL,   mirror = NULL )"},{"path":"/reference/open_soma.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Open the Census — open_soma","text":"census_version version Census, e.g., \"stable\". uri URI containing Census SOMA objects open instead released version. (supplied, takes precedence census_version.) tiledbsoma_ctx tiledbsoma::SOMATileDBContext built using new_SOMATileDBContext_for_census(). Optional (created automatically) using census_version context need reused. mirror Census mirror access; one names(get_census_mirror_directory()).","code":""},{"path":"/reference/open_soma.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Open the Census — open_soma","text":"Top-level tiledbsoma::SOMACollection object. use, census closed release memory resources, usually .exit(census$close(), add = TRUE). Closing top-level census also close SOMA objects accessed .","code":""},{"path":"/reference/open_soma.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Open the Census — open_soma","text":"","code":"census <- open_soma() #> The stable Census release is currently 2023-07-25. Specify census_version = \"2023-07-25\" in future calls to open_soma() to ensure data consistency. as.data.frame(census$get(\"census_info\")$get(\"summary\")$read()$concat()) #>   soma_joinid                      label      value #> 1           0      census_schema_version      1.0.0 #> 2           1          census_build_date 2023-07-25 #> 3           2     dataset_schema_version      3.0.0 #> 4           3           total_cell_count   61656118 #> 5           4          unique_cell_count   37447773 #> 6           5 number_donors_homo_sapiens      13035 #> 7           6 number_donors_mus_musculus       1417 census$close()"}]
+[{"path":"/LICENSE.html","id":null,"dir":"","previous_headings":"","what":"MIT License","title":"MIT License","text":"Copyright (c) 2023 Chan Zuckerberg Initiative Foundation Permission hereby granted, free charge, person obtaining copy software associated documentation files (“Software”), deal Software without restriction, including without limitation rights use, copy, modify, merge, publish, distribute, sublicense, /sell copies Software, permit persons Software furnished , subject following conditions: copyright notice permission notice shall included copies substantial portions Software. SOFTWARE PROVIDED “”, WITHOUT WARRANTY KIND, EXPRESS IMPLIED, INCLUDING LIMITED WARRANTIES MERCHANTABILITY, FITNESS PARTICULAR PURPOSE NONINFRINGEMENT. EVENT SHALL AUTHORS COPYRIGHT HOLDERS LIABLE CLAIM, DAMAGES LIABILITY, WHETHER ACTION CONTRACT, TORT OTHERWISE, ARISING , CONNECTION SOFTWARE USE DEALINGS SOFTWARE.","code":""},{"path":"/articles/census_access_maintained_embeddings.html","id":"open-census","dir":"Articles","previous_headings":"","what":"Open Census","title":"Access CELLxGENE collaboration embeddings (scVI, Geneformer)","text":"","code":"library(\"cellxgene.census\") census <- open_soma(census_version = \"2023-12-15\")"},{"path":"/articles/census_access_maintained_embeddings.html","id":"load-embeddings-as-seurat-reductions","dir":"Articles","previous_headings":"","what":"Load embeddings as Seurat reductions","title":"Access CELLxGENE collaboration embeddings (scVI, Geneformer)","text":"high-level cellxgene.census::get_seurat() function can query Census load embeddings dimensional reductions Seurat object. ask Seurat object expression data human cells tissue_general equal 'central nervous system', along scVI geneformer embeddings (obsm_layers). embeddings stored dimensional reductions seurat_obj, can take quick look scVI embeddings 2D scatter plot via UMAP, colored Census cell_type annotations.","code":"library(\"Seurat\")  seurat_obj <- get_seurat(   census,    organism = \"homo_sapiens\",   obs_value_filter = \"tissue_general == 'central nervous system'\",   obs_column_names = c(\"cell_type\"),   obsm_layers = c(\"scvi\",\"geneformer\") ) seurat_obj <- RunUMAP(   seurat_obj,    reduction = \"scvi\",   dims=1:ncol(Embeddings(seurat_obj, \"scvi\")) )  DimPlot(seurat_obj, reduction = \"umap\", group.by = \"cell_type\") +   theme(legend.text = element_text(size = 8))"},{"path":"/articles/census_access_maintained_embeddings.html","id":"load-embeddings-as-singlecellexperiment-reductions","dir":"Articles","previous_headings":"","what":"Load embeddings as SingleCellExperiment reductions","title":"Access CELLxGENE collaboration embeddings (scVI, Geneformer)","text":"Similarly, cellxgene.census::get_single_cell_experiment() can query Census store embeddings dimensionality reduction results Bioconductor SingleCellExperiment object. , can view UMAP Geneformer embeddings colored cell_type.","code":"library(\"SingleCellExperiment\") sce_obj <- get_single_cell_experiment(   census,    organism = \"homo_sapiens\",   obs_value_filter = \"tissue_general == 'central nervous system'\",   obs_column_names = c(\"cell_type\"),   obsm_layers = c(\"scvi\",\"geneformer\") ) sce_obj <- scater::runUMAP(sce_obj, dimred = \"geneformer\") scater::plotReducedDim(sce_obj, dimred = \"UMAP\", colour_by = \"cell_type\")"},{"path":"/articles/census_access_maintained_embeddings.html","id":"load-embeddings-as-sparsematrix","dir":"Articles","previous_headings":"","what":"Load embeddings as sparseMatrix","title":"Access CELLxGENE collaboration embeddings (scVI, Geneformer)","text":"Lastly, can use SOMAExperimentAxisQuery lower-level access embeddings’ numerical data. can performant use cases don’t need features Seurat SingleCellExperiment. row embeddings sparseMatrix provides fine-tuned Geneformer model’s 512-dimensional embedding vector cell, cell soma_joinids row names. different arguments, SOMAExperimentAxisQuery$to_sparse_matrix() can also read scVI embeddings expression data. Still lower-level access available SOMAExperimentAxisQuery$read(), streams Arrow tables. methods SOMAExperimentAxisQuery can fetch metadata like cell_type: SOMAExperimentAxisQuery loads ask Census, unlike high-level get_seurat() get_single_cell_experiment() functions, eagerly populate objects based query.","code":"query <- census$get(\"census_data\")$get(\"homo_sapiens\")$axis_query(   \"RNA\", obs_query = tiledbsoma::SOMAAxisQuery$new(value_filter = \"tissue == 'tongue'\") ) embeddings <- query$to_sparse_matrix(\"obsm\", \"geneformer\") str(embeddings) #> Formal class 'dgTMatrix' [package \"Matrix\"] with 6 slots #>   ..@ i       : int [1:190464] 0 0 0 0 0 0 0 0 0 0 ... #>   ..@ j       : int [1:190464] 0 1 2 3 4 5 6 7 8 9 ... #>   ..@ Dim     : int [1:2] 372 512 #>   ..@ Dimnames:List of 2 #>   .. ..$ : chr [1:372] \"51784858\" \"51784859\" \"51784860\" \"51784861\" ... #>   .. ..$ : chr [1:512] \"0\" \"1\" \"2\" \"3\" ... #>   ..@ x       : num [1:190464] 0.1104 -1.2031 1.0078 0.0131 1.2422 ... #>   ..@ factors : list() head(as.data.frame(query$obs(column_names = c(\"soma_joinid\",\"cell_type\"))$concat())) #>   soma_joinid  cell_type #> 1    51784858 basal cell #> 2    51784859 basal cell #> 3    51784860 fibroblast #> 4    51784861 fibroblast #> 5    51784862 basal cell #> 6    51784863 basal cell census$close()"},{"path":"/articles/census_citation_generation.html","id":"requirements","dir":"Articles","previous_headings":"","what":"Requirements","title":"Generating citations for Census slices","text":"notebook requires: cellxgene_census Python package. Census data release schema version 1.3.0 greater.","code":""},{"path":"/articles/census_citation_generation.html","id":"generating-citation-strings","dir":"Articles","previous_headings":"","what":"Generating citation strings","title":"Generating citations for Census slices","text":"First open handle Census data. ensure open data release schema version 1.3.0 greater, use census_version=\"latest\" load dataset table contains column \"citation\" dataset included Census. now can use column \"dataset_id\" present dataset table Census cell metadata create citation strings Census slice.","code":"library(\"tiledb\") library(\"cellxgene.census\")  census <- open_soma(census_version = \"latest\") census_release_info <- census$get(\"census_info\")$get(\"summary\")$read()$concat() as.data.frame(census_release_info) #>   soma_joinid                      label      value #> 1           0      census_schema_version      1.3.0 #> 2           1          census_build_date 2024-01-01 #> 3           2     dataset_schema_version      4.0.0 #> 4           3           total_cell_count   75694072 #> 5           4          unique_cell_count   45846761 #> 6           5 number_donors_homo_sapiens      16292 #> 7           6 number_donors_mus_musculus       2153 datasets <- census$get(\"census_info\")$get(\"datasets\")$read()$concat() datasets <- as.data.frame(datasets) head(datasets[\"citation\"]) #>                                                                                                                                                                                                                                                                                                citation #> 1                                                Dataset Version: https://datasets.cellxgene.cziscience.com/4fb3f166-6526-4a3d-b87f-b1cdc545b0f1.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/a0c84e3f-a5ca-4481-b3a5-ccfda0a81ecc #> 2                                                Dataset Version: https://datasets.cellxgene.cziscience.com/9edb54c2-3fe0-4a7a-bd62-a98e98299c5d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/a0c84e3f-a5ca-4481-b3a5-ccfda0a81ecc #> 3                                                Dataset Version: https://datasets.cellxgene.cziscience.com/0f88d425-2e51-4ecf-903a-921255537466.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/a0c84e3f-a5ca-4481-b3a5-ccfda0a81ecc #> 4                                                Dataset Version: https://datasets.cellxgene.cziscience.com/55c48748-ab69-457b-b9da-1858559f24f4.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/a0c84e3f-a5ca-4481-b3a5-ccfda0a81ecc #> 5 Publication: https://doi.org/10.1002/ctm2.1356 Dataset Version: https://datasets.cellxgene.cziscience.com/0574142b-eeb5-41e4-8d69-b613fd63e67b.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/7dd599c5-d25d-40c0-b1a6-8789791ca808 #> 6 Publication: https://doi.org/10.1002/ctm2.1356 Dataset Version: https://datasets.cellxgene.cziscience.com/507380ee-ba43-4f9a-a5c6-aea27ddb48cb.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/7dd599c5-d25d-40c0-b1a6-8789791ca808"},{"path":"/articles/census_citation_generation.html","id":"via-cell-metadata-query","dir":"Articles","previous_headings":"Generating citation strings","what":"Via cell metadata query","title":"Generating citations for Census slices","text":"","code":"# Query cell metadata cell_metadata <- census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(     value_filter = \"tissue == 'cardiac atrium'\",     column_names = c(\"dataset_id\", \"cell_type\") )  cell_metadata <- as.data.frame(cell_metadata$concat())  # Get a citation string for the slice slice_datasets = datasets[datasets$dataset_id  %in% cell_metadata$dataset_id,] print(slice_datasets$citation) #> [1] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [2] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [3] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [4] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [5] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [6] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\""},{"path":"/articles/census_citation_generation.html","id":"via-seurat-query","dir":"Articles","previous_headings":"Generating citation strings","what":"Via Seurat query","title":"Generating citations for Census slices","text":"","code":"# Fetch a Seurat object seurat_obj <- get_seurat(     census = census,     organism = \"homo_sapiens\",     measurement_name = \"RNA\",     obs_value_filter = \"tissue == 'cardiac atrium'\",     var_value_filter = \"feature_name == 'MYBPC3'\",     obs_column_names = c(\"dataset_id\", \"cell_type\") )  # Get a citation string for the slice slice_datasets = datasets[datasets$dataset_id  %in% seurat_obj[[]]$dataset_id,] print(slice_datasets$citation) #> [1] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [2] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [3] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [4] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [5] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [6] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\""},{"path":"/articles/census_citation_generation.html","id":"via-singlecellexperiment-query","dir":"Articles","previous_headings":"Generating citation strings","what":"Via SingleCellExperiment query","title":"Generating citations for Census slices","text":"","code":"# Fetch a Seurat object sce_obj <- get_single_cell_experiment(     census = census,     organism = \"homo_sapiens\",     measurement_name = \"RNA\",     obs_value_filter = \"tissue == 'cardiac atrium'\",     var_value_filter = \"feature_name == 'MYBPC3'\",     obs_column_names = c(\"dataset_id\", \"cell_type\") )  # Get a citation string for the slice slice_datasets = datasets[datasets$dataset_id  %in% sce_obj$dataset_id,] print(slice_datasets$citation) #> [1] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/4866a804-37eb-436f-8c87-9cd585260061.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [2] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/bfd80f12-725c-4482-ad7f-1ed2b4909b0d.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [3] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/e6df8a57-f54f-413a-9d4d-dee03294d778.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [4] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8d599205-5c51-4b50-9d48-3dec31238587.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [5] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/f6065c51-bd26-4aa5-a05d-2805aeea48d9.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\" #> [6] \"Publication: https://doi.org/10.1126/science.abl4896 Dataset Version: https://datasets.cellxgene.cziscience.com/8cdbf790-4d29-4f46-9aef-21adfb2e21da.h5ad curated and distributed by CZ CELLxGENE Discover in Collection: https://cellxgene.cziscience.com/collections/e5f58829-1a66-40b5-a624-9046778e74f5\""},{"path":"/articles/census_compute_over_X.html","id":"incremental-mean-calculation","dir":"Articles","previous_headings":"","what":"Incremental mean calculation","title":"Computing on X using online (incremental) algorithms","text":"Many statistics, marginal means, easy calculate incrementally. Let’s begin query X$raw sparse matrix unnormalized read counts, return results shards incrementally accumulate read count gene, divide cell count get mean reads per cell gene. First define query - case slice obs axis cells specific tissue & sex value, genes var axis. query$X() method returns iterator results, Arrow Table. table contain sparse X data obs/var coordinates, using standard SOMA names: soma_data - X values (float32) soma_dim_0 - obs coordinate (int64) soma_dim_1 - var coordinate (int64) Important: X matrices joined var/obs axis DataFrames integer join “id” (aka soma_joinid). positionally indexed, given cell gene may soma_joinid value (e.g., large integer). words, given X value, soma_dim_0 corresponds soma_joinid obs dataframe, soma_dim_1 coordinate corresponds soma_joinid var dataframe. convenience, query class includes utility simplify operations query slices. query$indexer indexer used wrap output query$X(), converting soma_joinids positional indexing query results. Positions [0, N), N number results query given axis. Key points: expensive query read results - rather make multiple passes data, read perform multiple computations. default, data census indexed soma_joinid positionally.","code":"library(\"tiledbsoma\") library(\"cellxgene.census\") census <- open_soma()  query <- census$get(\"census_data\")$get(\"mus_musculus\")$axis_query(   measurement_name = \"RNA\",   obs_query = SOMAAxisQuery$new(value_filter = \"tissue=='brain' && sex=='male'\") )  genes_df <- query$var(column_names = c(\"feature_id\", \"feature_name\"))$concat() genes_df <- as.data.frame(genes_df) n_genes <- nrow(genes_df)  # accumulator vector (for each gene) for the total count over all cells in X(\"raw\") raw_sum_by_gene <- numeric(n_genes) names(raw_sum_by_gene) <- genes_df$feature_id  # iterate through in-memory shards of query results tables <- query$X(\"raw\")$tables() while (!tables$read_complete()) {   table_part <- tables$read_next()   # table_part is an Arrow table with the columns mentioned above. The result   # order is not guaranteed!    # table_part$soma_dim_1 is the var/gene soma_joinid. But note that these are   # arbitrary int64 id's, and moreover each table_part may exhibit only a subset   # of the values we'll see over all query results. query$indexer helps us map   # any given soma_dim_1 values onto positions in query$var() (genes_df), that is   # the union of all values we'll see.   gene_indexes <- query$indexer$by_var(table_part$soma_dim_1)$as_vector()   stopifnot(sum(gene_indexes >= n_genes) == 0)   # sum(table_part) group by gene, yielding a numeric vector with the gene_index   # in its names   sum_part <- tapply(as.vector(table_part$soma_data), gene_indexes, sum)   # update the accumulator vector   which_genes <- as.integer(names(sum_part)) + 1  # nb: gene_indexes is zero-based   stopifnot(sum(which_genes > n_genes) == 0)   raw_sum_by_gene[which_genes] <- raw_sum_by_gene[which_genes] + sum_part }  # Divide each sum by cell count to get mean reads per cell (for each gene), # implicitly averaging in all zero entries in X even though they weren't included # in the sparse query results. genes_df$raw_mean <- raw_sum_by_gene / query$n_obs genes_df #>            feature_id  feature_name     raw_mean #> 1  ENSMUSG00000051951          Xkr4 1.397121e+00 #> 2  ENSMUSG00000025900           Rp1 3.162902e-01 #> 3  ENSMUSG00000025902         Sox17 6.604085e+01 #> 4  ENSMUSG00000033845        Mrpl15 3.939172e+01 #> 5  ENSMUSG00000025903        Lypla1 1.986548e+01 #> 6  ENSMUSG00000033813         Tcea1 4.305924e+01 #> 7  ENSMUSG00000002459         Rgs20 3.496194e+00 #> 8  ENSMUSG00000033793       Atp6v1h 7.470932e+01 #> 9  ENSMUSG00000025905         Oprk1 4.568752e-01 #> 10 ENSMUSG00000033774        Npbwr1 1.241003e-04 #> 11 ENSMUSG00000025907        Rb1cc1 3.631679e+01 #> 12 ENSMUSG00000033740          St18 1.660110e+01 #> 13 ENSMUSG00000051285        Pcmtd1 5.410501e+01 #> 14 ENSMUSG00000025909         Sntg1 1.178725e+00 #> 15 ENSMUSG00000061024          Rrs1 2.098927e+01 #> 16 ENSMUSG00000025911        Adhfe1 1.266112e+01 #> 17 ENSMUSG00000079671 2610203C22Rik 9.474621e+00 #> 18 ENSMUSG00000025912         Mybl1 2.643129e-01 #> 19 ENSMUSG00000045210        Vcpip1 3.456668e+01 #> 20 ENSMUSG00000097893 1700034P13Rik 5.721023e-01 #> 21 ENSMUSG00000025915          Sgk3 2.012592e+01 #> 22 ENSMUSG00000098234         Snhg6 6.784314e+00 #> 23 ENSMUSG00000025916       Ppp1r42 2.585422e-01 #> 24 ENSMUSG00000025917         Cops5 7.909310e+01 #> 25 ENSMUSG00000056763         Cspp1 1.635604e+01 #> 26 ENSMUSG00000067851       Arfgef1 1.582897e+01 #> 27 ENSMUSG00000042501          Cpa6 1.880119e-02 #> 28 ENSMUSG00000048960         Prex2 2.283623e+01 #> 29 ENSMUSG00000057715 A830018L16Rik 9.992140e-01 #> 30 ENSMUSG00000016918         Sulf1 5.567469e+00 #> 31 ENSMUSG00000025938       Slco5a1 2.452015e-01 #> 32 ENSMUSG00000042414        Prdm14 6.142964e-03 #> 33 ENSMUSG00000005886         Ncoa2 1.707928e+01 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 52384 rows ]"},{"path":"/articles/census_compute_over_X.html","id":"counting-cells-grouped-by-dataset-and-gene","dir":"Articles","previous_headings":"","what":"Counting cells grouped by dataset and gene","title":"Computing on X using online (incremental) algorithms","text":"goal example count number cells nonzero reads, grouped gene Census dataset_id. result data frame dataset, gene, number cells nonzero reads dataset gene. multi-factor aggregation, ’ll take advantage dplyr routines instead lower-level vector indexer shown . presentation purposes, ’ll limit query four genes, can expanded genes easily. Don’t forget close census.","code":"library(\"dplyr\")  query <- census$get(\"census_data\")$get(\"mus_musculus\")$axis_query(   measurement_name = \"RNA\",   obs_query = SOMAAxisQuery$new(value_filter = \"tissue=='brain'\"),   var_query = SOMAAxisQuery$new(value_filter = \"feature_name %in% c('Malat1', 'Ptprd', 'Dlg2', 'Pcdh9')\") )  obs_tbl <- query$obs(column_names=c(\"soma_joinid\", \"dataset_id\"))$concat() obs_df <- data.frame(   # materialize soma_joinid as character to avoid overflowing R 32-bit integer   cell_id = as.character(obs_tbl$soma_joinid),   dataset_id = obs_tbl$dataset_id$as_vector() ) var_tbl <- query$var(column_names=c(\"soma_joinid\", \"feature_name\"))$concat() var_df <- data.frame(   gene_id = as.character(var_tbl$soma_joinid),   feature_name = var_tbl$feature_name$as_vector() )  # accumulator for # cells by dataset & gene n_cells_grouped <- data.frame(   \"dataset_id\" = character(0),   \"gene_id\" = character(0),   \"n_cells\" = numeric(0) )  # iterate through in-memory shards of query results tables <- query$X(\"raw\")$tables() while (!tables$read_complete()) {   table_part <- tables$read_next()    # prepare a (dataset,gene,1) tuple for each entry in table_part   n_cells_part <- data.frame(     \"cell_id\" = as.character(table_part$soma_dim_0),     \"gene_id\" = as.character(table_part$soma_dim_1),     \"n_cells\" = 1   )   n_cells_part <- left_join(n_cells_part, obs_df, by = \"cell_id\")   stopifnot(sum(is.null(n_cells_part$dataset_id)) == 0)    # fold those into n_cells_grouped   n_cells_grouped <- n_cells_part %>%                      select(-cell_id) %>%                      bind_rows(n_cells_grouped) %>%                       group_by(dataset_id, gene_id) %>%                       summarise(n_cells = sum(n_cells)) %>%                       ungroup() }  # add gene names for display n_cells_grouped <- left_join(n_cells_grouped, var_df, by = \"gene_id\") stopifnot(sum(is.null(n_cells_grouped$feature_name)) == 0) n_cells_grouped[c(\"dataset_id\", \"feature_name\", \"n_cells\")] #> # A tibble: 21 × 3 #>    dataset_id                           feature_name n_cells #>    <chr>                                <chr>          <dbl> #>  1 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Ptprd          79578 #>  2 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Dlg2           79513 #>  3 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Pcdh9          79476 #>  4 3bbb6cf9-72b9-41be-b568-656de6eb18b5 Malat1         79667 #>  5 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Ptprd            474 #>  6 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Dlg2              81 #>  7 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Pcdh9            125 #>  8 58b01044-c5e5-4b0f-8a2d-6ebf951e01ff Malat1         12622 #>  9 66ff82b4-9380-469c-bc4b-cfa08eacd325 Dlg2             856 #> 10 66ff82b4-9380-469c-bc4b-cfa08eacd325 Pcdh9           2910 #> # ℹ 11 more rows census$close()"},{"path":"/articles/census_dataset_presence.html","id":"opening-the-census","dir":"Articles","previous_headings":"","what":"Opening the Census","title":"Genes measured in each cell (dataset presence matrix)","text":"cellxgene.census R package contains convenient API open version Census (default, newest stable version).","code":"library(\"cellxgene.census\") census <- open_soma()"},{"path":"/articles/census_dataset_presence.html","id":"fetching-the-ids-of-the-census-datasets","dir":"Articles","previous_headings":"","what":"Fetching the IDs of the Census datasets","title":"Genes measured in each cell (dataset presence matrix)","text":"Let’s grab table datasets included Census use table combination presence matrix .","code":"# Grab the experiment containing human data, and the measurement therein with RNA human <- census$get(\"census_data\")$get(\"homo_sapiens\") human_rna <- human$ms$get(\"RNA\")  # The census-wide datasets datasets_df <- as.data.frame(census$get(\"census_info\")$get(\"datasets\")$read()$concat()) print(datasets_df) #>    soma_joinid                        collection_id #> 1            0 4dca242c-d302-4dba-a68f-4c61e7bad553 #> 2            1 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f #> 3            2 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f #> 4            3 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f #> 5            4 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f #> 6            5 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f #> 7            6 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f #> 8            7 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f #> 9            8 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f #> 10           9 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f #> 11          10 d17249d2-0e6e-4500-abb8-e6c93fa1ac6f #>                                                                       collection_name #> 1                Comparative transcriptomics reveals human-specific cortical features #> 2  Transcriptomic cytoarchitecture reveals principles of human neocortex organization #> 3  Transcriptomic cytoarchitecture reveals principles of human neocortex organization #> 4  Transcriptomic cytoarchitecture reveals principles of human neocortex organization #> 5  Transcriptomic cytoarchitecture reveals principles of human neocortex organization #> 6  Transcriptomic cytoarchitecture reveals principles of human neocortex organization #> 7  Transcriptomic cytoarchitecture reveals principles of human neocortex organization #> 8  Transcriptomic cytoarchitecture reveals principles of human neocortex organization #> 9  Transcriptomic cytoarchitecture reveals principles of human neocortex organization #> 10 Transcriptomic cytoarchitecture reveals principles of human neocortex organization #> 11 Transcriptomic cytoarchitecture reveals principles of human neocortex organization #>             collection_doi                           dataset_id #> 1  10.1126/science.ade9516 2bdd3a2c-2ff4-4314-adf3-8a06b797a33a #> 2  10.1126/science.adf6812 f5b0810c-1664-4a62-ad06-be1d9964aa8b #> 3  10.1126/science.adf6812 e4ddac12-f48f-4455-8e8d-c2a48a683437 #> 4  10.1126/science.adf6812 e2808a6e-e2ea-41b9-b38c-4a08f1677f02 #> 5  10.1126/science.adf6812 d01c9dff-abd1-4825-bf30-2eb2ba74597e #> 6  10.1126/science.adf6812 c3aa4f95-7a18-4a7d-8dd8-ca324d714363 #> 7  10.1126/science.adf6812 be401db3-d732-408a-b0c4-71af0458b8ab #> 8  10.1126/science.adf6812 a5d5c529-8a1f-40b5-bda3-35208970070d #> 9  10.1126/science.adf6812 9c63201d-bfd9-41a8-bbbc-18d947556f3d #> 10 10.1126/science.adf6812 93cb76aa-a84b-4a92-8e6c-66a914e26d4c #> 11 10.1126/science.adf6812 8d1dd010-5cbc-43fb-83f8-e0de8e8517da #>                      dataset_version_id #> 1  7eb7f2fd-fd74-4c99-863c-97836415652e #> 2  d4427196-7876-4bdd-a929-ae4d177ec776 #> 3  3280113b-7148-4a3e-98d4-015f443aab8a #> 4  dc092185-3b8e-4fcb-ae21-1dc106d683ac #> 5  c4959ded-83dc-4442-aac7-9a59bdb47801 #> 6  0476ef54-aefe-4754-b0e9-d9fcd75adff4 #> 7  ee027704-72aa-4195-a467-0754db1ed65d #> 8  d47c0742-cea2-46c1-9e72-4d479214041c #> 9  8b09695a-1426-4867-961e-c40a1fbcc2da #> 10 98ad7381-f464-4f49-b850-5321b4f98be6 #> 11 c56683d2-452a-45dc-b402-35397e27e325 #>                                           dataset_title #> 1                               Human: Great apes study #> 2                       Dissection: Angular gyrus (AnG) #> 3                Supercluster: CGE-derived interneurons #> 4               Dissection: Primary auditory cortex(A1) #> 5  Supercluster: Deep layer (non-IT) excitatory neurons #> 6        Supercluster: IT-projecting excitatory neurons #> 7           Dissection: Anterior cingulate cortex (ACC) #> 8               Human Multiple Cortical Areas SMART-seq #> 9                Supercluster: MGE-derived interneurons #> 10        Dissection: Primary somatosensory cortex (S1) #> 11                Dissection: Primary visual cortex(V1) #>                            dataset_h5ad_path dataset_total_cell_count #> 1  2bdd3a2c-2ff4-4314-adf3-8a06b797a33a.h5ad                   156285 #> 2  f5b0810c-1664-4a62-ad06-be1d9964aa8b.h5ad                   110752 #> 3  e4ddac12-f48f-4455-8e8d-c2a48a683437.h5ad                   129495 #> 4  e2808a6e-e2ea-41b9-b38c-4a08f1677f02.h5ad                   139054 #> 5  d01c9dff-abd1-4825-bf30-2eb2ba74597e.h5ad                    92969 #> 6  c3aa4f95-7a18-4a7d-8dd8-ca324d714363.h5ad                   638941 #> 7  be401db3-d732-408a-b0c4-71af0458b8ab.h5ad                   135462 #> 8  a5d5c529-8a1f-40b5-bda3-35208970070d.h5ad                    49417 #> 9  9c63201d-bfd9-41a8-bbbc-18d947556f3d.h5ad                   185477 #> 10 93cb76aa-a84b-4a92-8e6c-66a914e26d4c.h5ad                   153159 #> 11 8d1dd010-5cbc-43fb-83f8-e0de8e8517da.h5ad                   241077 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 640 rows ]"},{"path":"/articles/census_dataset_presence.html","id":"fetching-the-dataset-presence-matrix","dir":"Articles","previous_headings":"","what":"Fetching the dataset presence matrix","title":"Genes measured in each cell (dataset presence matrix)","text":"Now let’s fetch dataset presence matrix. convenience, read entire presence matrix (Homo sapiens) sparse matrix. convenience function providing capability: also need var dataframe, read R data frame convenient manipulation:","code":"presence_matrix <- get_presence_matrix(census, \"Homo sapiens\", \"RNA\") print(dim(presence_matrix)) #> NULL var_df <- as.data.frame(human_rna$var$read()$concat()) print(var_df) #>    soma_joinid      feature_id feature_name feature_length      nnz n_measured_obs #> 1            0 ENSG00000233576      HTR3C2P           1057    69370       19581263 #> 2            1 ENSG00000121410         A1BG           3999  5640476       62641311 #> 3            2 ENSG00000268895     A1BG-AS1           3374  3071864       61946057 #> 4            3 ENSG00000148584         A1CF           9603   734347       58195911 #> 5            4 ENSG00000175899          A2M           6318  7894261       62704378 #> 6            5 ENSG00000245105      A2M-AS1           2948  1637794       62086816 #> 7            6 ENSG00000166535        A2ML1           7156  2156616       60911688 #> 8            7 ENSG00000256069        A2MP1           4657   835384       23554778 #> 9            8 ENSG00000184389      A3GALT2           1023   439067       53780311 #> 10           9 ENSG00000128274       A4GALT           3358  2432348       62706770 #> 11          10 ENSG00000118017        A4GNT           1779    52430       56117399 #> 12          11 ENSG00000265544         AA06            632   220755       22545140 #> 13          12 ENSG00000081760         AACS          16039 11280800       62842909 #> 14          13 ENSG00000250420       AACSP1           3380   211588       22831831 #> 15          14 ENSG00000114771        AADAC           1632   552258       54941618 #> 16          15 ENSG00000188984      AADACL3           4055    24626       43074608 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 60648 rows ]"},{"path":"/articles/census_dataset_presence.html","id":"identifying-genes-measured-in-a-specific-dataset","dir":"Articles","previous_headings":"","what":"Identifying genes measured in a specific dataset","title":"Genes measured in each cell (dataset presence matrix)","text":"Now dataset table, genes metadata table, dataset presence matrix, can check gene set genes measured specific dataset. Important: presence matrix indexed soma_joinid, positionally indexed. words: first dimension presence matrix dataset’s soma_joinid, stored census_datasets dataframe. second dimension presence matrix feature’s soma_joinid, stored var dataframe. presence matrix method $take() lets slice soma_joinids census_datasets var. full presence matrix, slices , can exported regular matrix method $get_one_based_matrix() Let’s find gene \"ENSG00000286096\" measured dataset id \"97a17473-e2b1-4f31-a544-44a60773e2dd\".","code":"# Get soma_joinid for datasets and genes of interest var_joinid <- var_df$soma_joinid[var_df$feature_id == \"ENSG00000286096\"] dataset_joinid <- datasets_df$soma_joinid[datasets_df$dataset_id == \"97a17473-e2b1-4f31-a544-44a60773e2dd\"]  # Slice presence matrix with datasets and genes of interest presence_matrix_slice <- presence_matrix$take(i = dataset_joinid, j = var_joinid)  # Convert presence matrix to regular matrix presence_matrix_slice <- presence_matrix_slice$get_one_based_matrix()  # Find how if the gene is present in this dataset is_present <- presence_matrix_slice[, , drop = TRUE] cat(paste(\"Feature is\", if (is_present) \"present.\" else \"not present.\")) #> Feature is present."},{"path":"/articles/census_dataset_presence.html","id":"identifying-datasets-that-measured-specific-genes","dir":"Articles","previous_headings":"","what":"Identifying datasets that measured specific genes","title":"Genes measured in each cell (dataset presence matrix)","text":"Similarly, can determine datasets measured specific gene set genes.","code":"# Grab the feature's soma_joinid from the var dataframe var_joinid <- var_df$soma_joinid[var_df$feature_id == \"ENSG00000286096\"]  # The presence matrix is indexed by the joinids of the dataset and var dataframes, # so slice out the feature of interest by its joinid. presence_matrix_slice  <- presence_matrix$take(j = var_joinid)$get_one_based_matrix() measured_datasets <- presence_matrix_slice[, , drop = TRUE] != 0 dataset_joinids <- datasets_df$soma_joinid[measured_datasets]  # From the datasets dataframe, slice out the datasets which have a joinid in the list print(datasets_df[dataset_joinids, ]) #>    soma_joinid                        collection_id #> 63          62 3f50314f-bdc9-40c6-8e4a-b0901ebfbe4c #> 64          63 e5f58829-1a66-40b5-a624-9046778e74f5 #> 65          64 e5f58829-1a66-40b5-a624-9046778e74f5 #> 66          65 e5f58829-1a66-40b5-a624-9046778e74f5 #> 67          66 e5f58829-1a66-40b5-a624-9046778e74f5 #> 69          68 e5f58829-1a66-40b5-a624-9046778e74f5 #> 70          69 e5f58829-1a66-40b5-a624-9046778e74f5 #> 72          71 e5f58829-1a66-40b5-a624-9046778e74f5 #> 73          72 e5f58829-1a66-40b5-a624-9046778e74f5 #> 77          76 e5f58829-1a66-40b5-a624-9046778e74f5 #> 78          77 e5f58829-1a66-40b5-a624-9046778e74f5 #>                                                                                                                             collection_name #> 63 Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy #> 64                                                                                                                           Tabula Sapiens #> 65                                                                                                                           Tabula Sapiens #> 66                                                                                                                           Tabula Sapiens #> 67                                                                                                                           Tabula Sapiens #> 69                                                                                                                           Tabula Sapiens #> 70                                                                                                                           Tabula Sapiens #> 72                                                                                                                           Tabula Sapiens #> 73                                                                                                                           Tabula Sapiens #> 77                                                                                                                           Tabula Sapiens #> 78                                                                                                                           Tabula Sapiens #>                 collection_doi                           dataset_id #> 63 10.1016/j.ccell.2021.03.007 bd65a70f-b274-4133-b9dd-0d1431b6af34 #> 64     10.1126/science.abl4896 ff45e623-7f5f-46e3-b47d-56be0341f66b #> 65     10.1126/science.abl4896 f01bdd17-4902-40f5-86e3-240d66dd2587 #> 66     10.1126/science.abl4896 e6a11140-2545-46bc-929e-da243eed2cae #> 67     10.1126/science.abl4896 e5c63d94-593c-4338-a489-e1048599e751 #> 69     10.1126/science.abl4896 d77ec7d6-ef2e-49d6-9e79-05b7f8881484 #> 70     10.1126/science.abl4896 cee11228-9f0b-4e57-afe2-cfe15ee56312 #> 72     10.1126/science.abl4896 a2d4d33e-4c62-4361-b80a-9be53d2e50e8 #> 73     10.1126/science.abl4896 a0754256-f44b-4c4a-962c-a552e47d3fdc #> 77     10.1126/science.abl4896 6d41668c-168c-4500-b06a-4674ccf3e19d #> 78     10.1126/science.abl4896 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c #>                      dataset_version_id #> 63 71815674-a8cf-4add-95dd-c5d5d1631597 #> 64 0b29f4ce-5e72-4356-b74b-b54714979234 #> 65 bd13c169-af97-4d8f-ba45-7588808c2e48 #> 66 47615a3d-0a9f-4a78-88ef-5cce2a84637d #> 67 ac7714f0-dce2-40ba-9912-324de6c9a77f #> 69 c7679ec2-652d-437a-bded-3ec2344829e4 #> 70 f89fa18f-c32b-4bae-9511-1a4d18f200e1 #> 72 37ada0d2-9970-4ff2-8bcd-41e80ab6e081 #> 73 1cda78aa-f0d9-4d50-96bf-8bc309318802 #> 77 5297a910-453f-4e3f-af16-e18fd5a79090 #> 78 b783b036-c837-4290-a07d-f6b79a301f59 #>                                                                                                                               dataset_title #> 63 Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy #> 64                                                                                                                Tabula Sapiens - Pancreas #> 65                                                                                                          Tabula Sapiens - Salivary_Gland #> 66                                                                                                                   Tabula Sapiens - Heart #> 67                                                                                                                 Tabula Sapiens - Bladder #> 69                                                                                                                Tabula Sapiens - Prostate #> 70                                                                                                                  Tabula Sapiens - Spleen #> 72                                                                                                             Tabula Sapiens - Vasculature #> 73                                                                                                                     Tabula Sapiens - Eye #> 77                                                                                                                   Tabula Sapiens - Liver #> 78                                                                                                                     Tabula Sapiens - Fat #>                            dataset_h5ad_path dataset_total_cell_count #> 63 bd65a70f-b274-4133-b9dd-0d1431b6af34.h5ad                   167283 #> 64 ff45e623-7f5f-46e3-b47d-56be0341f66b.h5ad                    13497 #> 65 f01bdd17-4902-40f5-86e3-240d66dd2587.h5ad                    27199 #> 66 e6a11140-2545-46bc-929e-da243eed2cae.h5ad                    11505 #> 67 e5c63d94-593c-4338-a489-e1048599e751.h5ad                    24583 #> 69 d77ec7d6-ef2e-49d6-9e79-05b7f8881484.h5ad                    16375 #> 70 cee11228-9f0b-4e57-afe2-cfe15ee56312.h5ad                    34004 #> 72 a2d4d33e-4c62-4361-b80a-9be53d2e50e8.h5ad                    16037 #> 73 a0754256-f44b-4c4a-962c-a552e47d3fdc.h5ad                    10650 #> 77 6d41668c-168c-4500-b06a-4674ccf3e19d.h5ad                     5007 #> 78 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c.h5ad                    20263 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 31 rows ]"},{"path":"/articles/census_dataset_presence.html","id":"identifying-all-genes-measured-in-a-dataset","dir":"Articles","previous_headings":"","what":"Identifying all genes measured in a dataset","title":"Genes measured in each cell (dataset presence matrix)","text":"Finally, can find set genes measured cells given dataset.","code":"# Slice the dataset(s) of interest, and get the joinid(s) dataset_joinids <- datasets_df$soma_joinid[datasets_df$collection_id == \"17481d16-ee44-49e5-bcf0-28c0780d8c4a\"]  # Slice the presence matrix by the first dimension, i.e., by dataset presence_matrix_slice <- presence_matrix$take(i = dataset_joinids)$get_one_based_matrix() genes_measured <- Matrix::colSums(presence_matrix_slice) > 0 var_joinids <- var_df$soma_joinid[genes_measured]  print(var_df[var_joinids, ]) #>    soma_joinid      feature_id feature_name feature_length      nnz n_measured_obs #> 1            0 ENSG00000233576      HTR3C2P           1057    69370       19581263 #> 2            1 ENSG00000121410         A1BG           3999  5640476       62641311 #> 3            2 ENSG00000268895     A1BG-AS1           3374  3071864       61946057 #> 4            3 ENSG00000148584         A1CF           9603   734347       58195911 #> 5            4 ENSG00000175899          A2M           6318  7894261       62704378 #> 6            5 ENSG00000245105      A2M-AS1           2948  1637794       62086816 #> 9            8 ENSG00000184389      A3GALT2           1023   439067       53780311 #> 10           9 ENSG00000128274       A4GALT           3358  2432348       62706770 #> 12          11 ENSG00000265544         AA06            632   220755       22545140 #> 14          13 ENSG00000250420       AACSP1           3380   211588       22831831 #> 16          15 ENSG00000188984      AADACL3           4055    24626       43074608 #> 18          17 ENSG00000240602      AADACP1           2012    29491       23133490 #> 19          18 ENSG00000109576        AADAT           2970  4524608       61559099 #> 20          19 ENSG00000158122       PRXL2C           3098  5424472       55618144 #> 21          20 ENSG00000103591        AAGAB           4138 12427442       62843055 #> 22          21 ENSG00000115977         AAK1          24843 29280566       62664775 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 27195 rows ]"},{"path":"/articles/census_dataset_presence.html","id":"close-the-census","dir":"Articles","previous_headings":"Identifying all genes measured in a dataset","what":"Close the census","title":"Genes measured in each cell (dataset presence matrix)","text":"use, census object closed release memory resources. also closes SOMA objects accessed via top-level census. Closing can automated using .exit(census$close(), add = TRUE) immediately census <- open_soma().","code":"census$close()"},{"path":"/articles/census_datasets.html","id":"fetching-the-datasets-table","dir":"Articles","previous_headings":"","what":"Fetching the datasets table","title":"Census Datasets example","text":"Census contains top-level data frame itemizing datasets contained therein. can read SOMADataFrame Arrow Table: R data frame: sum cell counts across datasets match number cells across SOMA experiments (human, mouse).","code":"library(\"cellxgene.census\") census <- open_soma() census_datasets <- census$get(\"census_info\")$get(\"datasets\")$read()$concat() print(census_datasets) #> Table #> 651 rows x 9 columns #> $soma_joinid <int64 not null> #> $collection_id <large_string not null> #> $collection_name <large_string not null> #> $collection_doi <large_string not null> #> $dataset_id <large_string not null> #> $dataset_version_id <large_string not null> #> $dataset_title <large_string not null> #> $dataset_h5ad_path <large_string not null> #> $dataset_total_cell_count <int64 not null> census_datasets <- as.data.frame(census_datasets) print(census_datasets[, c(   \"dataset_id\",   \"dataset_title\",   \"dataset_total_cell_count\" )]) #>                              dataset_id #> 1  2bdd3a2c-2ff4-4314-adf3-8a06b797a33a #> 2  f5b0810c-1664-4a62-ad06-be1d9964aa8b #> 3  e4ddac12-f48f-4455-8e8d-c2a48a683437 #> 4  e2808a6e-e2ea-41b9-b38c-4a08f1677f02 #> 5  d01c9dff-abd1-4825-bf30-2eb2ba74597e #> 6  c3aa4f95-7a18-4a7d-8dd8-ca324d714363 #> 7  be401db3-d732-408a-b0c4-71af0458b8ab #> 8  a5d5c529-8a1f-40b5-bda3-35208970070d #> 9  9c63201d-bfd9-41a8-bbbc-18d947556f3d #> 10 93cb76aa-a84b-4a92-8e6c-66a914e26d4c #> 11 8d1dd010-5cbc-43fb-83f8-e0de8e8517da #> 12 716a4acc-919e-4326-9672-ebe06ede84e6 #> 13 5bdc423a-59e6-457d-aa01-debd2c9c564f #> 14 5346f9c6-755e-4336-94cc-38706ec00c2f #> 15 015c230d-650c-4527-870d-8a805849a382 #> 16 d567b692-c374-4628-a508-8008f6778f22 #> 17 cf83c98a-3791-4537-bbde-a719f6d73c13 #> 18 738942eb-ac72-44ff-a64b-8943b5ecd8d9 #> 19 f8d8b443-bca6-4c3c-9042-669dfb7f8030 #> 20 f5be4b96-f5a3-4c3d-84ac-6f69daf744d5 #> 21 dea1aa78-c0a2-413f-b375-f91cce49e4d0 #> 22 92161459-9103-4379-ae34-73a38eee1d1d #> 23 5829c7ba-697f-418e-8b98-d605b192dc48 #> 24 4dd1cd23-fc4d-4fd1-9709-602540f3ca6f #> 25 2856d06c-0ff9-4e01-bfc9-202b74d0b60f #> 26 251b1a7e-d050-4486-8d50-4c2619eb0f46 #> 27 07760522-707a-4a1c-8891-dbd1226d6b27 #> 28 9fcb0b73-c734-40a5-be9c-ace7eea401c9 #> 29 1a38e762-2465-418f-b81c-6a4bce261c34 #> 30 f16a8f4d-bc97-43c5-a2f6-bbda952e4c5c #> 31 94c41723-b2c4-4b59-a49a-64c9b851903e #> 32 6ceeaa86-9ceb-4582-b390-6d4dd6ff0572 #> 33 9a64bf99-ebe5-4276-93a8-bee9dff1cd47 #> 34 fc0ceb80-d2d9-47c1-9d78-b0e45c64c500 #> 35 d0ea3ec4-0f3b-4649-9146-1c0b5f303a55 #> 36 b8920ef5-7d22-497b-abca-a7a9eb76d79a #> 37 b1d37bbd-9ae4-4404-b2f9-f2fe66750e4e #> 38 a4e89c26-e8d4-4471-9b06-16a1405880f0 #> 39 a190b2e9-3796-4785-9a2f-013e2a9a43e6 #> 40 9ff9f9ba-016b-4cbb-8899-45dc20860b8b #> 41 9940f951-3dc0-4579-bbb2-2392786e59a3 #> 42 74d584f0-74fc-482e-b944-e76f29c1ab85 #> 43 6f7fd0f1-a2ed-4ff1-80d3-33dde731cbc3 #> 44 6cda07c7-5d7a-41ba-9799-5bb73da25a60 #> 45 646e3e87-e46b-4b12-85b5-8d8589e26088 #> 46 6437bc9c-16cb-46c8-8f79-9a7384a0212a #> 47 58c43cc2-e00e-43c4-94eb-8501369264e1 #> 48 53bc5729-6202-4351-bc99-1f36139e9dc4 #> 49 44c83972-e5d2-4858-ac58-2df9f4bf564b #> 50 2ecc72f8-085f-4e86-8692-771f316c54f6 #> 51 2e5a9b5d-d31b-4e9f-a179-d5d70ba459fb #> 52 1c9f5c6b-73da-4d17-95de-df080ffe0df1 #> 53 100c6145-7b0e-4ba6-81c1-ffebed0d1ac4 #> 54 0ed60482-a34f-4268-b576-d69cc30210f6 #> 55 0eccaf0c-19d2-4900-9962-899378adf8be #> 56 04c94a7d-1133-42c9-bb48-c697bd302a8d #> 57 0374f03c-62e2-4859-8a14-acb00b0627d5 #> 58 03181d87-4769-41e7-8c39-d9a81835f0d2 #> 59 f171db61-e57e-4535-a06a-35d8b6ef8f2b #> 60 ecf2e08e-2032-4a9e-b466-b65b395f4a02 #> 61 74cff64f-9da9-4b2a-9b3b-8a04a1598040 #> 62 5af90777-6760-4003-9dba-8f945fec6fdf #> 63 bd65a70f-b274-4133-b9dd-0d1431b6af34 #> 64 ff45e623-7f5f-46e3-b47d-56be0341f66b #> 65 f01bdd17-4902-40f5-86e3-240d66dd2587 #> 66 e6a11140-2545-46bc-929e-da243eed2cae #> 67 e5c63d94-593c-4338-a489-e1048599e751 #> 68 d8732da6-8d1d-42d9-b625-f2416c30054b #> 69 d77ec7d6-ef2e-49d6-9e79-05b7f8881484 #> 70 cee11228-9f0b-4e57-afe2-cfe15ee56312 #> 71 a357414d-2042-4eb5-95f0-c58604a18bdd #> 72 a2d4d33e-4c62-4361-b80a-9be53d2e50e8 #> 73 a0754256-f44b-4c4a-962c-a552e47d3fdc #> 74 983d5ec9-40e8-4512-9e65-a572a9c486cb #> 75 7357cee7-9f7f-4ab0-8cec-90de8f047e38 #> 76 6ec405bb-4727-4c6d-ab4e-01fe489af7ea #> 77 6d41668c-168c-4500-b06a-4674ccf3e19d #> 78 5e5e7a2f-8f1c-42ac-90dc-b4f80f38e84c #> 79 55cf0ea3-9d2b-4294-871e-bb4b49a79fc7 #> 80 4f1555bc-4664-46c3-a606-78d34dd10d92 #> 81 2ba40233-8576-4dec-a5f1-2adfa115e2dc #> 82 2423ce2c-3149-4cca-a2ff-cf682ea29b5f #> 83 1c9eb291-6d31-47e1-96b2-129b5e1ae64f #> 84 18eb630b-a754-4111-8cd4-c24ec80aa5ec #> 85 0d2ee4ac-05ee-40b2-afb6-ebb584caa867 #>                                                                                                                               dataset_title #> 1                                                                                                                   Human: Great apes study #> 2                                                                                                           Dissection: Angular gyrus (AnG) #> 3                                                                                                    Supercluster: CGE-derived interneurons #> 4                                                                                                   Dissection: Primary auditory cortex(A1) #> 5                                                                                      Supercluster: Deep layer (non-IT) excitatory neurons #> 6                                                                                            Supercluster: IT-projecting excitatory neurons #> 7                                                                                               Dissection: Anterior cingulate cortex (ACC) #> 8                                                                                                   Human Multiple Cortical Areas SMART-seq #> 9                                                                                                    Supercluster: MGE-derived interneurons #> 10                                                                                            Dissection: Primary somatosensory cortex (S1) #> 11                                                                                                    Dissection: Primary visual cortex(V1) #> 12                                                                                         Dissection: Dorsolateral prefrontal cortex (DFC) #> 13                                                                                                    Dissection: Primary motor cortex (M1) #> 14                                                                                                         Supercluster: Non-neuronal cells #> 15                                                                                                  Dissection: Middle temporal gyrus (MTG) #> 16                                                                       Combined single cell and single nuclei RNA-Seq data - Heart Global #> 17                                                                                                    Global dataset of infant KMT2Ar B-ALL #> 18                                                                                     Normal immune cells landscape of infant KMT2Ar B-ALL #> 19                                                                                                      Human Human Microglia 10x scRNA-seq #> 20                                                                                                    Human Endothelial cells 10x scRNA-seq #> 21                                                                                                 Human Nurr-Negative Nuclei 10x scRNA-seq #> 22                                                                                                 Human Nurr-Positive Nuclei 10x scRNA-seq #> 23                                                                                                     Human Oligodendrocytes 10x scRNA-seq #> 24                                                                                                            Human OPC Cells 10x scRNA-seq #> 25                                                                                                           Human DA Neurons 10x scRNA-seq #> 26                                                                                                       Human Non-DA Neurons 10x scRNA-seq #> 27                                                                                                           Human Astrocytes 10x scRNA-seq #> 28                                                                              An Integrated Single Cell Meta-atlas of Human Periodontitis #> 29                                                                Single-cell analysis of prenatal and postnatal human cortical development #> 30                                                       All - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse #> 31                                                                                    snRNA-seq of human anterior and posterior hippocampus #> 32                                                                                                                        3-prime FGID data #> 33                                                      Single-Cell RNA Sequencing of Breast Tissues: Cell Subtypes and Cancer Risk Factors #> 34                                                                            Sst Chodl - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 35                                                                                  L6b - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 36                                                                              L5/6 NP - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 37                                                                                 Sncg - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 38                                                                                L6 CT - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 39                                                                           Lamp5 Lhx6 - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 40                                                                                L4 IT - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 41                                                                      Oligodendrocyte - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 42                                                                            Astrocyte - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 43                                                                       Whole Taxonomy - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 44                                                                                L5 ET - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 45                                                                              L2/3 IT - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 46                                                                                L6 IT - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 47                                                                                  OPC - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 48                                                                                  Vip - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 49                                                                                L5 IT - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 50                                                                          Endothelial - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 51                                                                                 VLMC - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 52                                                                           L6 IT Car3 - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 53                                                                        Microglia-PVM - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 54                                                                                Lamp5 - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 55                                                                                 Pax6 - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 56                                                                                Pvalb - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 57                                                                           Chandelier - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 58                                                                                  Sst - DLPFC: Seattle Alzheimer's Disease Atlas (SEA-AD) #> 59                                                                                                                   donor_p13_trophoblasts #> 60                                                                                                                  All donors trophoblasts #> 61                                                                                                     All donors all cell states (in vivo) #> 62                                                                     Single-cell transcriptomic datasets of Renal cell carcinoma patients #> 63 Single-cell sequencing links multiregional immune landscapes and tissue-resident T cells in ccRCC to tumor topology and therapy efficacy #> 64                                                                                                                Tabula Sapiens - Pancreas #> 65                                                                                                          Tabula Sapiens - Salivary_Gland #> 66                                                                                                                   Tabula Sapiens - Heart #> 67                                                                                                                 Tabula Sapiens - Bladder #> 68                                                                                                                 Tabula Sapiens - Trachea #> 69                                                                                                                Tabula Sapiens - Prostate #> 70                                                                                                                  Tabula Sapiens - Spleen #> 71                                                                                                         Tabula Sapiens - Small_Intestine #> 72                                                                                                             Tabula Sapiens - Vasculature #> 73                                                                                                                     Tabula Sapiens - Eye #> 74                                                                                                                   Tabula Sapiens - Blood #> 75                                                                                                         Tabula Sapiens - Large_Intestine #> 76                                                                                                                  Tabula Sapiens - Uterus #> 77                                                                                                                   Tabula Sapiens - Liver #> 78                                                                                                                     Tabula Sapiens - Fat #> 79                                                                                                                  Tabula Sapiens - Tongue #> 80                                                                                                             Tabula Sapiens - Bone_Marrow #> 81                                                                                                                 Tabula Sapiens - Mammary #> 82                                                                                                                  Tabula Sapiens - Kidney #> 83                                                                                                                  Tabula Sapiens - Muscle #> 84                                                                                                              Tabula Sapiens - Lymph_Node #> 85                                                                                                                    Tabula Sapiens - Lung #>    dataset_total_cell_count #> 1                    156285 #> 2                    110752 #> 3                    129495 #> 4                    139054 #> 5                     92969 #> 6                    638941 #> 7                    135462 #> 8                     49417 #> 9                    185477 #> 10                   153159 #> 11                   241077 #> 12                   113339 #> 13                   114605 #> 14                   108940 #> 15                   148374 #> 16                   493236 #> 17                   128588 #> 18                    36313 #> 19                    33041 #> 20                    14903 #> 21                   104097 #> 22                    80576 #> 23                   178815 #> 24                    13691 #> 25                    22048 #> 26                    91479 #> 27                    33506 #> 28                   105918 #> 29                   700391 #> 30                   356213 #> 31                   129905 #> 32                    89849 #> 33                    52681 #> 34                     1772 #> 35                    17996 #> 36                    18154 #> 37                    23640 #> 38                    27454 #> 39                    21603 #> 40                    76195 #> 41                   136076 #> 42                    82936 #> 43                  1309414 #> 44                     3848 #> 45                   317116 #> 46                    44174 #> 47                    27670 #> 48                    95014 #> 49                    97173 #> 50                     2496 #> 51                     4619 #> 52                    13007 #> 53                    40625 #> 54                    52828 #> 55                     8984 #> 56                   109618 #> 57                    14871 #> 58                    71545 #> 59                    31497 #> 60                    67070 #> 61                   286326 #> 62                   270855 #> 63                   167283 #> 64                    13497 #> 65                    27199 #> 66                    11505 #> 67                    24583 #> 68                     9522 #> 69                    16375 #> 70                    34004 #> 71                    12467 #> 72                    16037 #> 73                    10650 #> 74                    50115 #> 75                    13680 #> 76                     7124 #> 77                     5007 #> 78                    20263 #> 79                    15020 #> 80                    12297 #> 81                    11375 #> 82                     9641 #> 83                    30746 #> 84                    53275 #> 85                    35682 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 566 rows ] census_data <- census$get(\"census_data\") all_experiments <- lapply(census_data$to_list(), function(x) census_data$get(x$name)) print(all_experiments) #> $homo_sapiens #> <SOMAExperiment> #>   uri: s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/census_data/homo_sapiens  #>   arrays: obs*  #>   groups: ms*  #>  #> $mus_musculus #> <SOMAExperiment> #>   uri: s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/census_data/mus_musculus  #>   arrays: obs*  #>   groups: ms* experiments_total_cells <- sum(sapply(all_experiments, function(x) {   nrow(x$obs$read(column_names = c(\"soma_joinid\"))$concat()) }))  print(paste(\"Found\", experiments_total_cells, \"cells in all experiments.\")) #> [1] \"Found 68683222 cells in all experiments.\" print(paste(   \"Found\", sum(as.vector(census_datasets$dataset_total_cell_count)),   \"cells in all datasets.\" )) #> [1] \"Found 68683222 cells in all datasets.\""},{"path":"/articles/census_datasets.html","id":"fetching-the-expression-data-from-a-single-dataset","dir":"Articles","previous_headings":"","what":"Fetching the expression data from a single dataset","title":"Census Datasets example","text":"Let’s pick one dataset slice census, turn Seurat -memory object. (requires Seurat package installed beforehand.) Create query mouse experiment, “RNA” measurement, dataset_id.","code":"census_datasets[census_datasets$dataset_id == \"0bd1a1de-3aee-40e0-b2ec-86c7a30c7149\", ] #>     soma_joinid                        collection_id    collection_name #> 581         580 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis #>                collection_doi                           dataset_id #> 581 10.1038/s41586-020-2496-1 0bd1a1de-3aee-40e0-b2ec-86c7a30c7149 #>                       dataset_version_id #> 581 ff352f35-58a2-4962-b716-649d1f9e9f44 #>                                                                                        dataset_title #> 581 Bone marrow - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - 10x #>                             dataset_h5ad_path dataset_total_cell_count #> 581 0bd1a1de-3aee-40e0-b2ec-86c7a30c7149.h5ad                    40220 library(\"tiledbsoma\") obs_query <- SOMAAxisQuery$new(   value_filter = \"dataset_id == '0bd1a1de-3aee-40e0-b2ec-86c7a30c7149'\" ) expt_query <- census_data$get(\"mus_musculus\")$axis_query(   measurement_name = \"RNA\",   obs_query = obs_query ) dataset_seurat <- expt_query$to_seurat(c(counts = \"raw\")) print(dataset_seurat) #> An object of class Seurat  #> 52417 features across 40220 samples within 1 assay  #> Active assay: RNA (52417 features, 0 variable features) #>  2 layers present: counts, data #>  1 dimensional reduction calculated: scvi"},{"path":"/articles/census_datasets.html","id":"downloading-the-original-source-h5ad-file-of-a-dataset","dir":"Articles","previous_headings":"","what":"Downloading the original source H5AD file of a dataset","title":"Census Datasets example","text":"can use cellxgene.census::get_source_h5ad_uri() API fetch URI pointing H5AD associated dataset_id. H5AD can download CZ CELLxGENE Discover, may contain additional data-submitter provided information included Census. can fetch location cloud directly download system. local H5AD file can used R using SeuratDisk’s anndata converter.","code":"# Option 1: Direct download download_source_h5ad(   dataset_id = \"0bd1a1de-3aee-40e0-b2ec-86c7a30c7149\",   file = \"/tmp/Tabula_Muris_Senis-bone_marrow.h5ad\",   overwrite = TRUE ) # Option 2: Get location and download via preferred method get_source_h5ad_uri(\"0bd1a1de-3aee-40e0-b2ec-86c7a30c7149\") #> $uri #> [1] \"s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/h5ads/0bd1a1de-3aee-40e0-b2ec-86c7a30c7149.h5ad\" #>  #> $s3_region #> [1] \"us-west-2\""},{"path":"/articles/census_datasets.html","id":"close-the-census","dir":"Articles","previous_headings":"Downloading the original source H5AD file of a dataset","what":"Close the census","title":"Census Datasets example","text":"use, census object closed release memory resources. also closes SOMA objects accessed via top-level census. Closing can automated using .exit(census$close(), add = TRUE) immediately census <- open_soma().","code":"census$close()"},{"path":"/articles/census_query_extract.html","id":"opening-the-census","dir":"Articles","previous_headings":"","what":"Opening the census","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"cellxgene.census R package contains convenient API open version Census (default, newest stable version). can learn cellxgene.census methods accessing corresponding documentation, example ?cellxgene.census::open_soma.","code":"library(\"cellxgene.census\") census <- open_soma()"},{"path":"/articles/census_query_extract.html","id":"querying-cell-metadata-obs","dir":"Articles","previous_headings":"","what":"Querying cell metadata (obs)","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"human gene metadata Census, RNA assays, located census$get(\"census_data\")$get(\"homo_sapiens\")$obs. SOMADataFrame can materialized R data frame (tibble) using .data.frame(obs$read()$concat()). mouse cell metadata census$get(\"census_data\")$get(\"mus_musculus\").obs. slicing cell metadata two relevant arguments can passed read(): column_names — character vector indicating metadata columns fetch. Expressions one comparisons Comparisons one <column> <op> <value> <column> <op> <column> Expressions can combine comparisons using && || op one < | > | <= | >= | == | != %% learn metadata columns available fetching filtering can directly look keys cell metadata. soma_joinid special SOMADataFrame column used join operations. definition columns can found Census schema. can used fetch specific columns specific rows matching condition. latter need know values looking priori. example let’s see possible values available sex. can load cell metadata fetching column sex. can see three different values sex, \"male\", \"female\" \"unknown\". information can fetch cell metatadata specific sex value, example \"unknown\". can use column_names value_filter perform specific queries. example let’s fetch disease column cell_type \"B cell\" tissue_general \"lung\".","code":"census$get(\"census_data\")$get(\"homo_sapiens\")$obs$colnames() #>  [1] \"soma_joinid\"                              #>  [2] \"dataset_id\"                               #>  [3] \"assay\"                                    #>  [4] \"assay_ontology_term_id\"                   #>  [5] \"cell_type\"                                #>  [6] \"cell_type_ontology_term_id\"               #>  [7] \"development_stage\"                        #>  [8] \"development_stage_ontology_term_id\"       #>  [9] \"disease\"                                  #> [10] \"disease_ontology_term_id\"                 #> [11] \"donor_id\"                                 #> [12] \"is_primary_data\"                          #> [13] \"self_reported_ethnicity\"                  #> [14] \"self_reported_ethnicity_ontology_term_id\" #> [15] \"sex\"                                      #> [16] \"sex_ontology_term_id\"                     #> [17] \"suspension_type\"                          #> [18] \"tissue\"                                   #> [19] \"tissue_ontology_term_id\"                  #> [20] \"tissue_general\"                           #> [21] \"tissue_general_ontology_term_id\"          #> [22] \"raw_sum\"                                  #> [23] \"nnz\"                                      #> [24] \"raw_mean_nnz\"                             #> [25] \"raw_variance_nnz\"                         #> [26] \"n_measured_vars\" unique(as.data.frame(census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(column_names = \"sex\")$concat())) #>             sex #> 1          male #> 224      female #> 3747640 unknown as.data.frame(census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(value_filter = \"sex == 'unknown'\")$concat()) #>   soma_joinid                           dataset_id     assay assay_ontology_term_id #> 1     3747639 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899 #> 2     3747640 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899 #> 3     3747641 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899 #> 4     3747642 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899 #> 5     3747643 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899 #> 6     3747644 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899 #> 7     3747645 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899 #> 8     3747646 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899 #> 9     3747647 9fcb0b73-c734-40a5-be9c-ace7eea401c9 10x 3' v2            EFO:0009899 #>    cell_type cell_type_ontology_term_id development_stage #> 1 fibroblast                 CL:0000057 human adult stage #> 2 fibroblast                 CL:0000057 human adult stage #> 3 fibroblast                 CL:0000057 human adult stage #> 4 fibroblast                 CL:0000057 human adult stage #> 5 fibroblast                 CL:0000057 human adult stage #> 6 fibroblast                 CL:0000057 human adult stage #> 7 fibroblast                 CL:0000057 human adult stage #> 8 fibroblast                 CL:0000057 human adult stage #> 9 fibroblast                 CL:0000057 human adult stage #>   development_stage_ontology_term_id disease disease_ontology_term_id #> 1                     HsapDv:0000087  normal             PATO:0000461 #> 2                     HsapDv:0000087  normal             PATO:0000461 #> 3                     HsapDv:0000087  normal             PATO:0000461 #> 4                     HsapDv:0000087  normal             PATO:0000461 #> 5                     HsapDv:0000087  normal             PATO:0000461 #> 6                     HsapDv:0000087  normal             PATO:0000461 #> 7                     HsapDv:0000087  normal             PATO:0000461 #> 8                     HsapDv:0000087  normal             PATO:0000461 #> 9                     HsapDv:0000087  normal             PATO:0000461 #>                       donor_id is_primary_data self_reported_ethnicity #> 1 Pagella_GSE161267_GSM4904134            TRUE                 unknown #> 2 Pagella_GSE161267_GSM4904134            TRUE                 unknown #> 3 Pagella_GSE161267_GSM4904134            TRUE                 unknown #> 4 Pagella_GSE161267_GSM4904134            TRUE                 unknown #> 5 Pagella_GSE161267_GSM4904134            TRUE                 unknown #> 6 Pagella_GSE161267_GSM4904134            TRUE                 unknown #> 7 Pagella_GSE161267_GSM4904134            TRUE                 unknown #> 8 Pagella_GSE161267_GSM4904134            TRUE                 unknown #> 9 Pagella_GSE161267_GSM4904134            TRUE                 unknown #>   self_reported_ethnicity_ontology_term_id     sex sex_ontology_term_id suspension_type #> 1                                  unknown unknown              unknown            cell #> 2                                  unknown unknown              unknown            cell #> 3                                  unknown unknown              unknown            cell #> 4                                  unknown unknown              unknown            cell #> 5                                  unknown unknown              unknown            cell #> 6                                  unknown unknown              unknown            cell #> 7                                  unknown unknown              unknown            cell #> 8                                  unknown unknown              unknown            cell #> 9                                  unknown unknown              unknown            cell #>    tissue tissue_ontology_term_id tissue_general tissue_general_ontology_term_id #> 1 gingiva          UBERON:0001828         mucosa                  UBERON:0000344 #> 2 gingiva          UBERON:0001828         mucosa                  UBERON:0000344 #> 3 gingiva          UBERON:0001828         mucosa                  UBERON:0000344 #> 4 gingiva          UBERON:0001828         mucosa                  UBERON:0000344 #> 5 gingiva          UBERON:0001828         mucosa                  UBERON:0000344 #> 6 gingiva          UBERON:0001828         mucosa                  UBERON:0000344 #> 7 gingiva          UBERON:0001828         mucosa                  UBERON:0000344 #> 8 gingiva          UBERON:0001828         mucosa                  UBERON:0000344 #> 9 gingiva          UBERON:0001828         mucosa                  UBERON:0000344 #>   raw_sum  nnz raw_mean_nnz raw_variance_nnz n_measured_vars #> 1     547  329     1.662614        14.559604           31602 #> 2     982  563     1.744227         5.315247           31602 #> 3   12467 3809     3.273038       109.305683           31602 #> 4    1053  566     1.860424         7.430042           31602 #> 5     548  363     1.509642         2.410818           31602 #> 6     678  429     1.580420        11.379616           31602 #> 7     848  524     1.618321         9.437216           31602 #> 8     935  608     1.537829         4.868418           31602 #> 9     735  485     1.515464         6.213087           31602 #>  [ reached 'max' / getOption(\"max.print\") -- omitted 3301779 rows ] cell_metadata_b_cell <- census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(   value_filter = \"cell_type == 'B cell' & tissue_general == 'lung'\",   column_names = \"disease\" )  cell_metadata_b_cell <- as.data.frame(cell_metadata_b_cell$concat())  table(cell_metadata_b_cell) #> disease #> chronic obstructive pulmonary disease                              COVID-19  #>                                  6369                                  2729  #>          hypersensitivity pneumonitis             interstitial lung disease  #>                                    52                                   376  #>                   lung adenocarcinoma             lung large cell carcinoma  #>                                 62351                                  1534  #>              lymphangioleiomyomatosis         non-small cell lung carcinoma  #>                                   133                                 17484  #>   non-specific interstitial pneumonia                                normal  #>                                   231                                 25461  #>                 pleomorphic carcinoma                             pneumonia  #>                                  1210                                    50  #>                   pulmonary emphysema                    pulmonary fibrosis  #>                                  1512                                  6798  #>                 pulmonary sarcoidosis             small cell lung carcinoma  #>                                     6                                   583  #>          squamous cell lung carcinoma  #>                                 11920"},{"path":"/articles/census_query_extract.html","id":"querying-gene-metadata-var","dir":"Articles","previous_headings":"","what":"Querying gene metadata (var)","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"human gene metadata Census located census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$var. Similarly cell metadata, SOMADataFrame thus can also use method read(). mouse gene metadata census$get(\"census_data\")$get(\"mus_musculus\")$ms$get(\"RNA\")$var. Let’s take look metadata available column selection row filtering. exception soma_joinid columns defined Census schema. Similarly cell metadata, can use operations learn fetch gene metadata. example, get feature_name feature_length genes \"ENSG00000161798\" \"ENSG00000188229\" can following.","code":"census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$var$colnames() #> [1] \"soma_joinid\"    \"feature_id\"     \"feature_name\"   \"feature_length\" \"nnz\"            #> [6] \"n_measured_obs\" var_df <- census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$var$read(   value_filter = \"feature_id %in% c('ENSG00000161798', 'ENSG00000188229')\",   column_names = c(\"feature_name\", \"feature_length\") )  as.data.frame(var_df$concat()) #>   feature_name feature_length #> 1         AQP5           1884 #> 2       TUBB4B           2037"},{"path":"/articles/census_query_extract.html","id":"querying-expression-data-as-seurat","dir":"Articles","previous_headings":"","what":"Querying expression data as Seurat","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"convenient way query fetch expression data use get_seurat method cellxgene.census API. method combines column selection value filtering described obtain slices expression data based metadata queries. method return Seurat object, takes input census object, string organism, cell gene metadata can specify filters column selection described following arguments: obs_column_names — character vector indicating columns select cell metadata. obs_value_filter — expression selection conditions fetch cells meeting criteria. var_column_names — character vector indicating columns select gene metadata. var_value_filter — expression selection conditions fetch genes meeting criteria. example want fetch expression data : Genes \"ENSG00000161798\" \"ENSG00000188229\". \"B cells\" \"lung\" \"COVID-19\". gene metadata adding sex cell metadata. full description refer ?cellxgene.census::get_seurat.","code":"library(\"Seurat\")  seurat_obj <- get_seurat(   census, \"Homo sapiens\",   obs_column_names = c(\"cell_type\", \"tissue_general\", \"disease\", \"sex\"),   var_value_filter = \"feature_id %in% c('ENSG00000161798', 'ENSG00000188229')\",   obs_value_filter = \"cell_type == 'B cell' & tissue_general == 'lung' & disease == 'COVID-19'\" ) seurat_obj #> An object of class Seurat  #> 2 features across 2729 samples within 1 assay  #> Active assay: RNA (2 features, 0 variable features) #>  2 layers present: counts, data head(seurat_obj[[]]) #>                 orig.ident nCount_RNA nFeature_RNA cell_type tissue_general  disease #> cell13391229 SeuratProject          0            0    B cell           lung COVID-19 #> cell13393737 SeuratProject          1            1    B cell           lung COVID-19 #> cell13394391 SeuratProject          0            0    B cell           lung COVID-19 #> cell13394897 SeuratProject          0            0    B cell           lung COVID-19 #> cell13395941 SeuratProject          0            0    B cell           lung COVID-19 #> cell13397408 SeuratProject          0            0    B cell           lung COVID-19 #>                  sex #> cell13391229    male #> cell13393737 unknown #> cell13394391    male #> cell13394897 unknown #> cell13395941    male #> cell13397408 unknown head(seurat_obj$RNA[[]]) #>                 feature_name feature_length      nnz n_measured_obs #> ENSG00000161798         AQP5           1884  1029069       58250439 #> ENSG00000188229       TUBB4B           2037 21416107       62655002"},{"path":"/articles/census_query_extract.html","id":"querying-expression-data-as-singlecellexperiment","dir":"Articles","previous_headings":"","what":"Querying expression data as SingleCellExperiment","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"Similarly previous section, get_single_cell_experiment method cellxgene.census API. behaves exactly get_seurat returns SingleCellExperiment object. example, repeat query can simply following. full description refer ?cellxgene.census::get_single_cell_experiment.","code":"library(\"SingleCellExperiment\")  sce_obj <- get_single_cell_experiment(   census, \"Homo sapiens\",   obs_column_names = c(\"cell_type\", \"tissue_general\", \"disease\", \"sex\"),   var_value_filter = \"feature_id %in% c('ENSG00000161798', 'ENSG00000188229')\",   obs_value_filter = \"cell_type == 'B cell' & tissue_general == 'lung' & disease == 'COVID-19'\" ) sce_obj #> class: SingleCellExperiment  #> dim: 2 2729  #> metadata(0): #> assays(1): counts #> rownames(2): ENSG00000161798 ENSG00000188229 #> rowData names(4): feature_name feature_length nnz n_measured_obs #> colnames(2729): obs13391229 obs13393737 ... obs54635684 obs54635708 #> colData names(4): cell_type tissue_general disease sex #> reducedDimNames(0): #> mainExpName: RNA #> altExpNames(0): head(colData(sce_obj)) #> DataFrame with 6 rows and 4 columns #>               cell_type tissue_general     disease         sex #>             <character>    <character> <character> <character> #> obs13391229      B cell           lung    COVID-19        male #> obs13393737      B cell           lung    COVID-19     unknown #> obs13394391      B cell           lung    COVID-19        male #> obs13394897      B cell           lung    COVID-19     unknown #> obs13395941      B cell           lung    COVID-19        male #> obs13397408      B cell           lung    COVID-19     unknown head(rowData(sce_obj)) #> DataFrame with 2 rows and 4 columns #>                 feature_name feature_length       nnz n_measured_obs #>                  <character>      <integer> <integer>      <integer> #> ENSG00000161798         AQP5           1884   1029069       58250439 #> ENSG00000188229       TUBB4B           2037  21416107       62655002"},{"path":"/articles/census_query_extract.html","id":"close-the-census","dir":"Articles","previous_headings":"Querying expression data as SingleCellExperiment","what":"Close the census","title":"Querying and fetching the single-cell data and cell/gene metadata","text":"use, census object closed release memory resources. also closes SOMA objects accessed via top-level census. Closing can automated using .exit(census$close(), add = TRUE) immediately census <- open_soma().","code":"census$close()"},{"path":"/articles/comp_bio_census_info.html","id":"opening-the-census","dir":"Articles","previous_headings":"","what":"Opening the Census","title":"Learning about the CZ CELLxGENE Census","text":"cellxgene.census R package contains convenient open_soma() API open version Census (stable default). can learn cellxgene.census methods accessing corresponding documentation, example ?cellxgene.census::open_soma.","code":"library(\"cellxgene.census\") census <- open_soma()"},{"path":"/articles/comp_bio_census_info.html","id":"census-organization","dir":"Articles","previous_headings":"","what":"Census organization","title":"Learning about the CZ CELLxGENE Census","text":"Census schema defines structure Census. short, can think Census structured collection items stores different pieces information. items parent collection SOMA objects various types can accessed TileDB-SOMA API (documentation). cellxgene.census package contains convenient wrappers TileDB-SOMA API. example function used open Census: cellxgene_census.open_soma().","code":""},{"path":"/articles/comp_bio_census_info.html","id":"main-census-components","dir":"Articles","previous_headings":"Census organization","what":"Main Census components","title":"Learning about the CZ CELLxGENE Census","text":"command created census, SOMACollection, R6 class providing key-value associative map. get() method can access two top-level collection members, census_info census_data, instances SOMACollection.","code":""},{"path":"/articles/comp_bio_census_info.html","id":"census-summary-info","dir":"Articles","previous_headings":"Census organization","what":"Census summary info","title":"Learning about the CZ CELLxGENE Census","text":"census$get(\"census_info\")$get(\"summary\"): data frame high-level information Census, e.g. build date, total cell count, etc. census$get(\"census_info\")$get(\"datasets\"): data frame datasets CELLxGENE Discover used create Census. census$get(\"census_info\")$get(\"summary_cell_counts\"): data frame cell counts stratified relevant cell metadata Census data Data organism stored independent SOMAExperiment objects specialized form SOMACollection. store data matrix (cell genes), cell metadata, gene metadata, useful components covered notebook. data organized one organism – Homo sapiens: census$get(\"census_data\")$get(\"homo_sapiens\")$obs: Cell metadata census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\"): Data matrices, currently … census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$X$get(\"raw\"): matrix raw counts SOMASparseNDArray census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$var: Gene Metadata","code":""},{"path":"/articles/comp_bio_census_info.html","id":"cell-metadata","dir":"Articles","previous_headings":"","what":"Cell metadata","title":"Learning about the CZ CELLxGENE Census","text":"can obtain cell metadata variables directly querying columns corresponding SOMADataFrame. variables can used querying Census case want work specific cells. variables defined CELLxGENE dataset schema except following: soma_joinid: SOMA-defined value use join operations. dataset_id: dataset id encoded census$get(\"census_info\")$get(\"datasets\"). tissue_general tissue_general_ontology_term_id: high-level tissue mapping.","code":"census$get(\"census_data\")$get(\"homo_sapiens\")$obs$colnames() #>  [1] \"soma_joinid\"                              #>  [2] \"dataset_id\"                               #>  [3] \"assay\"                                    #>  [4] \"assay_ontology_term_id\"                   #>  [5] \"cell_type\"                                #>  [6] \"cell_type_ontology_term_id\"               #>  [7] \"development_stage\"                        #>  [8] \"development_stage_ontology_term_id\"       #>  [9] \"disease\"                                  #> [10] \"disease_ontology_term_id\"                 #> [11] \"donor_id\"                                 #> [12] \"is_primary_data\"                          #> [13] \"self_reported_ethnicity\"                  #> [14] \"self_reported_ethnicity_ontology_term_id\" #> [15] \"sex\"                                      #> [16] \"sex_ontology_term_id\"                     #> [17] \"suspension_type\"                          #> [18] \"tissue\"                                   #> [19] \"tissue_ontology_term_id\"                  #> [20] \"tissue_general\"                           #> [21] \"tissue_general_ontology_term_id\"          #> [22] \"raw_sum\"                                  #> [23] \"nnz\"                                      #> [24] \"raw_mean_nnz\"                             #> [25] \"raw_variance_nnz\"                         #> [26] \"n_measured_vars\""},{"path":"/articles/comp_bio_census_info.html","id":"gene-metadata","dir":"Articles","previous_headings":"","what":"Gene metadata","title":"Learning about the CZ CELLxGENE Census","text":"Similarly, can obtain gene metadata variables directly querying columns corresponding SOMADataFrame. variables can use querying Census case specific genes interested . variables defined CELLxGENE dataset schema except following: soma_joinid: SOMA-defined value use join operations. feature_length: length base pairs gene.","code":"census$get(\"census_data\")$get(\"homo_sapiens\")$ms$get(\"RNA\")$var$colnames() #> [1] \"soma_joinid\"    \"feature_id\"     \"feature_name\"   \"feature_length\" \"nnz\"            #> [6] \"n_measured_obs\""},{"path":"/articles/comp_bio_census_info.html","id":"census-summary-content-tables","dir":"Articles","previous_headings":"","what":"Census summary content tables","title":"Learning about the CZ CELLxGENE Census","text":"can take quick look high-level Census information looking census$get(\"census_info\")$get(\"summary\"): special interest label-value combinations : total_cell_count total number cells Census. unique_cell_count number unique cells, cells may present twice due meta-analysis consortia-like data. number_donors_homo_sapiens number_donors_mus_musculus number individuals human mouse. guaranteed unique one individual ID may present identical different datasets.","code":"as.data.frame(census$get(\"census_info\")$get(\"summary\")$read()$concat()) #>   soma_joinid                      label      value #> 1           0      census_schema_version      1.2.0 #> 2           1          census_build_date 2023-10-23 #> 3           2     dataset_schema_version      3.1.0 #> 4           3           total_cell_count   68683222 #> 5           4          unique_cell_count   40356133 #> 6           5 number_donors_homo_sapiens      15588 #> 7           6 number_donors_mus_musculus       1990"},{"path":"/articles/comp_bio_census_info.html","id":"cell-counts-by-cell-metadata","dir":"Articles","previous_headings":"Census summary content tables","what":"Cell counts by cell metadata","title":"Learning about the CZ CELLxGENE Census","text":"looking census$get(\"census_info)$get(\"summary_cell_counts\") can get general idea cell counts stratified relevant cell metadata. cell metadata included table, can take look cell gene metadata available sections “Cell metadata” “Gene metadata”. line retrieves table casts R data frame: combination organism values category cell metadata can take look total_cell_count unique_cell_count cell counts combination. values category specified ontology_term_id label, value’s IDs labels, respectively.","code":"census_counts <- as.data.frame(census$get(\"census_info\")$get(\"summary_cell_counts\")$read()$concat()) head(census_counts) #>   soma_joinid     organism category ontology_term_id unique_cell_count total_cell_count #> 1           0 Homo sapiens      all               na          36227903         62998417 #> 2           1 Homo sapiens    assay      EFO:0008722            264166           279635 #> 3           2 Homo sapiens    assay      EFO:0008780             25652            51304 #> 4           3 Homo sapiens    assay      EFO:0008796             54753            54753 #> 5           4 Homo sapiens    assay      EFO:0008919             89477           206754 #> 6           5 Homo sapiens    assay      EFO:0008931             78750           188248 #>        label #> 1         na #> 2   Drop-seq #> 3     inDrop #> 4   MARS-seq #> 5   Seq-Well #> 6 Smart-seq2"},{"path":"/articles/comp_bio_census_info.html","id":"example-cell-metadata-included-in-the-summary-counts-table","dir":"Articles","previous_headings":"Census summary content tables > Cell counts by cell metadata","what":"Example: cell metadata included in the summary counts table","title":"Learning about the CZ CELLxGENE Census","text":"get available cell metadata summary counts table can following. Remember cell metadata available, variables omitted creation table.","code":"t(table(census_counts$organism, census_counts$category)) #>                           #>                           Homo sapiens Mus musculus #>   all                                1            1 #>   assay                             20           10 #>   cell_type                        631          248 #>   disease                           72            5 #>   self_reported_ethnicity           30            1 #>   sex                                3            3 #>   suspension_type                    1            1 #>   tissue                           230           74 #>   tissue_general                    53           27"},{"path":"/articles/comp_bio_census_info.html","id":"example-cell-counts-for-each-sequencing-assay-in-human-data","dir":"Articles","previous_headings":"Census summary content tables > Cell counts by cell metadata","what":"Example: cell counts for each sequencing assay in human data","title":"Learning about the CZ CELLxGENE Census","text":"get cell counts sequencing assay type human data, can perform following operations:","code":"human_assay_counts <- census_counts[census_counts$organism == \"Homo sapiens\" & census_counts$category == \"assay\", ] human_assay_counts <- human_assay_counts[order(human_assay_counts$total_cell_count, decreasing = TRUE), ]"},{"path":"/articles/comp_bio_census_info.html","id":"example-number-of-microglial-cells-in-the-census","dir":"Articles","previous_headings":"Census summary content tables > Cell counts by cell metadata","what":"Example: number of microglial cells in the Census","title":"Learning about the CZ CELLxGENE Census","text":"specific term categories shown can directly find number cells term.","code":"census_counts[census_counts$label == \"microglial cell\", ] #>      soma_joinid     organism  category ontology_term_id unique_cell_count #> 72            71 Homo sapiens cell_type       CL:0000129            359243 #> 1080        1079 Mus musculus cell_type       CL:0000129             48998 #>      total_cell_count           label #> 72             544977 microglial cell #> 1080            75885 microglial cell"},{"path":"/articles/comp_bio_census_info.html","id":"understanding-census-contents-beyond-the-summary-tables","dir":"Articles","previous_headings":"","what":"Understanding Census contents beyond the summary tables","title":"Learning about the CZ CELLxGENE Census","text":"using pre-computed tables census$get(\"census_info\") easy quick way understand contents Census, falls short want learn certain slices Census. example, may want learn : cell types available human liver? total number cells lung datasets stratified sequencing technology? sex distribution cells brain mouse? diseases available T cells? questions can answered directly querying cell metadata shown examples .","code":""},{"path":"/articles/comp_bio_census_info.html","id":"example-all-cell-types-available-in-human","dir":"Articles","previous_headings":"Understanding Census contents beyond the summary tables","what":"Example: all cell types available in human","title":"Learning about the CZ CELLxGENE Census","text":"exemplify process accessing slicing cell metadata summary stats, let’s start trivial example take look human cell types available Census: number rows total number cells humans. Now, wish get cell counts per cell type can work data frame. addition, focus cells marked is_primary_data=TRUE ensures de-duplicate cells appear CELLxGENE Discover. number unique cells. Now let’s look counts per cell type: shows abundant cell types “glutamatergic neuron”, “CD8-positive, alpha-beta T cell”, “CD4-positive, alpha-beta T cell”. Now let’s take look number unique cell types: total number different cell types human. information example can quickly obtained summary table census$get(\"census-info\")$get(\"summary_cell_counts\"). examples complex can achieved accessing cell metadata.","code":"obs_df <-   census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(column_names = c(\"cell_type\", \"is_primary_data\")) as.data.frame(obs_df$concat()) #>                            cell_type is_primary_data #> 1                    oligodendrocyte           FALSE #> 2     oligodendrocyte precursor cell           FALSE #> 3   astrocyte of the cerebral cortex           FALSE #> 4   astrocyte of the cerebral cortex           FALSE #> 5   astrocyte of the cerebral cortex           FALSE #> 6     oligodendrocyte precursor cell           FALSE #> 7   astrocyte of the cerebral cortex           FALSE #> 8                    microglial cell           FALSE #> 9   astrocyte of the cerebral cortex           FALSE #> 10  astrocyte of the cerebral cortex           FALSE #> 11  astrocyte of the cerebral cortex           FALSE #> 12  astrocyte of the cerebral cortex           FALSE #> 13  astrocyte of the cerebral cortex           FALSE #> 14  astrocyte of the cerebral cortex           FALSE #> 15  astrocyte of the cerebral cortex           FALSE #> 16    oligodendrocyte precursor cell           FALSE #> 17                   oligodendrocyte           FALSE #> 18  astrocyte of the cerebral cortex           FALSE #> 19  astrocyte of the cerebral cortex           FALSE #> 20  astrocyte of the cerebral cortex           FALSE #> 21  astrocyte of the cerebral cortex           FALSE #> 22  astrocyte of the cerebral cortex           FALSE #> 23    oligodendrocyte precursor cell           FALSE #> 24  astrocyte of the cerebral cortex           FALSE #> 25  astrocyte of the cerebral cortex           FALSE #> 26    oligodendrocyte precursor cell           FALSE #> 27                   microglial cell           FALSE #> 28                   oligodendrocyte           FALSE #> 29  astrocyte of the cerebral cortex           FALSE #> 30  cerebral cortex endothelial cell           FALSE #> 31                   microglial cell           FALSE #> 32                   microglial cell           FALSE #> 33                   microglial cell           FALSE #> 34                   oligodendrocyte           FALSE #> 35                   oligodendrocyte           FALSE #> 36                   microglial cell           FALSE #> 37                   oligodendrocyte           FALSE #> 38                   oligodendrocyte           FALSE #> 39  astrocyte of the cerebral cortex           FALSE #> 40                   oligodendrocyte           FALSE #> 41  astrocyte of the cerebral cortex           FALSE #> 42                   oligodendrocyte           FALSE #> 43    oligodendrocyte precursor cell           FALSE #> 44                   oligodendrocyte           FALSE #> 45  astrocyte of the cerebral cortex           FALSE #> 46    oligodendrocyte precursor cell           FALSE #> 47                   oligodendrocyte           FALSE #> 48    oligodendrocyte precursor cell           FALSE #> 49  astrocyte of the cerebral cortex           FALSE #> 50  astrocyte of the cerebral cortex           FALSE #> 51  astrocyte of the cerebral cortex           FALSE #> 52                   oligodendrocyte           FALSE #> 53                   oligodendrocyte           FALSE #> 54                   oligodendrocyte           FALSE #> 55  astrocyte of the cerebral cortex           FALSE #> 56  cerebral cortex endothelial cell           FALSE #> 57                   oligodendrocyte           FALSE #> 58                   oligodendrocyte           FALSE #> 59                   oligodendrocyte           FALSE #> 60                   microglial cell           FALSE #> 61                   microglial cell           FALSE #> 62    oligodendrocyte precursor cell           FALSE #> 63    oligodendrocyte precursor cell           FALSE #> 64                   oligodendrocyte           FALSE #> 65    oligodendrocyte precursor cell           FALSE #> 66                   oligodendrocyte           FALSE #> 67  astrocyte of the cerebral cortex           FALSE #> 68                   oligodendrocyte           FALSE #> 69    oligodendrocyte precursor cell           FALSE #> 70                   oligodendrocyte           FALSE #> 71  astrocyte of the cerebral cortex           FALSE #> 72  astrocyte of the cerebral cortex           FALSE #> 73  astrocyte of the cerebral cortex           FALSE #> 74    oligodendrocyte precursor cell           FALSE #> 75  astrocyte of the cerebral cortex           FALSE #> 76    oligodendrocyte precursor cell           FALSE #> 77                   microglial cell           FALSE #> 78                   microglial cell           FALSE #> 79    oligodendrocyte precursor cell           FALSE #> 80                   oligodendrocyte           FALSE #> 81                   oligodendrocyte           FALSE #> 82  astrocyte of the cerebral cortex           FALSE #> 83                   oligodendrocyte           FALSE #> 84  astrocyte of the cerebral cortex           FALSE #> 85  astrocyte of the cerebral cortex           FALSE #> 86                   oligodendrocyte           FALSE #> 87  astrocyte of the cerebral cortex           FALSE #> 88                   oligodendrocyte           FALSE #> 89    oligodendrocyte precursor cell           FALSE #> 90    oligodendrocyte precursor cell           FALSE #> 91  astrocyte of the cerebral cortex           FALSE #> 92  astrocyte of the cerebral cortex           FALSE #> 93  astrocyte of the cerebral cortex           FALSE #> 94                   oligodendrocyte           FALSE #> 95  astrocyte of the cerebral cortex           FALSE #> 96  astrocyte of the cerebral cortex           FALSE #> 97                   oligodendrocyte           FALSE #> 98                   oligodendrocyte           FALSE #> 99    oligodendrocyte precursor cell           FALSE #> 100                  oligodendrocyte           FALSE #> 101                  oligodendrocyte           FALSE #> 102                  oligodendrocyte           FALSE #> 103 astrocyte of the cerebral cortex           FALSE #> 104   oligodendrocyte precursor cell           FALSE #> 105                  oligodendrocyte           FALSE #> 106   oligodendrocyte precursor cell           FALSE #> 107                  oligodendrocyte           FALSE #> 108                  oligodendrocyte           FALSE #> 109                  oligodendrocyte           FALSE #> 110                  oligodendrocyte           FALSE #> 111   oligodendrocyte precursor cell           FALSE #> 112                  oligodendrocyte           FALSE #> 113                  oligodendrocyte           FALSE #> 114 astrocyte of the cerebral cortex           FALSE #> 115                  oligodendrocyte           FALSE #> 116 astrocyte of the cerebral cortex           FALSE #> 117                  oligodendrocyte           FALSE #> 118                  oligodendrocyte           FALSE #> 119                  oligodendrocyte           FALSE #> 120 astrocyte of the cerebral cortex           FALSE #> 121 astrocyte of the cerebral cortex           FALSE #> 122   oligodendrocyte precursor cell           FALSE #> 123                  microglial cell           FALSE #> 124 astrocyte of the cerebral cortex           FALSE #> 125 astrocyte of the cerebral cortex           FALSE #> 126                  microglial cell           FALSE #> 127 cerebral cortex endothelial cell           FALSE #> 128   oligodendrocyte precursor cell           FALSE #>  [ reached 'max' / getOption(\"max.print\") -- omitted 62998289 rows ] obs_df <- census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(   column_names = \"cell_type\",   value_filter = \"is_primary_data == TRUE\" )  obs_df <- as.data.frame(obs_df$concat()) nrow(obs_df) #> [1] 36227903 human_cell_type_counts <- table(obs_df$cell_type) sort(human_cell_type_counts, decreasing = TRUE)[1:10] #>  #>                                                             neuron  #>                                                            2815336  #>                                               glutamatergic neuron  #>                                                            1563446  #>                                    CD4-positive, alpha-beta T cell  #>                                                            1243885  #>                                    CD8-positive, alpha-beta T cell  #>                                                            1197715  #> L2/3-6 intratelencephalic projecting glutamatergic cortical neuron  #>                                                            1123360  #>                                                    oligodendrocyte  #>                                                            1063874  #>                                                 classical monocyte  #>                                                            1030996  #>                                                        native cell  #>                                                            1011949  #>                                                             B cell  #>                                                             934060  #>                                                natural killer cell  #>                                                             770637 length(human_cell_type_counts) #> [1] 610"},{"path":"/articles/comp_bio_census_info.html","id":"example-cell-types-available-in-human-liver","dir":"Articles","previous_headings":"Understanding Census contents beyond the summary tables","what":"Example: cell types available in human liver","title":"Learning about the CZ CELLxGENE Census","text":"Similar example , can learn cell types available specific tissue, e.g. liver. achieve goal just need limit cell metadata tissue. use information cell metadata variable tissue_general. variable contains high-level tissue label cells Census: cell types cell counts human liver.","code":"obs_liver_df <- census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(   column_names = \"cell_type\",   value_filter = \"is_primary_data == TRUE & tissue_general == 'liver'\" )  obs_liver_df <- as.data.frame(obs_liver_df$concat())  sort(table(obs_liver_df$cell_type), decreasing = TRUE)[1:10] #>  #>                          T cell                     hepatoblast  #>                           85739                           58447  #>                 neoplastic cell                    erythroblast  #>                           52431                           45605  #>                        monocyte                      hepatocyte  #>                           31388                           28309  #>             natural killer cell    periportal region hepatocyte  #>                           26871                           23509  #>                      macrophage centrilobular region hepatocyte  #>                           16707                           15819"},{"path":"/articles/comp_bio_census_info.html","id":"example-diseased-t-cells-in-human-tissues","dir":"Articles","previous_headings":"Understanding Census contents beyond the summary tables","what":"Example: diseased T cells in human tissues","title":"Learning about the CZ CELLxGENE Census","text":"example going get counts diseased cells annotated T cells. sake example focus “CD8-positive, alpha-beta T cell” “CD4-positive, alpha-beta T cell”: cell counts annotated indicated disease across human tissues “CD8-positive, alpha-beta T cell” “CD4-positive, alpha-beta T cell”.","code":"obs_t_cells_df <- census$get(\"census_data\")$get(\"homo_sapiens\")$obs$read(   column_names = c(\"disease\", \"tissue_general\"),   value_filter = \"is_primary_data == TRUE & disease != 'normal' & cell_type %in% c('CD8-positive, alpha-beta T cell', 'CD4-positive, alpha-beta T cell')\" )  obs_t_cells_df <- as.data.frame(obs_t_cells_df$concat())  print(table(obs_t_cells_df)) #>                                        tissue_general #> disease                                 adrenal gland  blood bone marrow  brain breast #>   breast cancer                                     0      0           0      0   1850 #>   chronic obstructive pulmonary disease             0      0           0      0      0 #>   chronic rhinitis                                  0      0           0      0      0 #>   clear cell renal carcinoma                        0   6548           0      0      0 #>   COVID-19                                          0 819428           0      0      0 #>   Crohn disease                                     0      0           0      0      0 #>   cystic fibrosis                                   0      0           0      0      0 #>   Down syndrome                                     0      0         181      0      0 #>   follicular lymphoma                               0      0           0      0      0 #>   influenza                                         0   8871           0      0      0 #>   interstitial lung disease                         0      0           0      0      0 #>   kidney benign neoplasm                            0      0           0      0      0 #>   kidney oncocytoma                                 0      0           0      0      0 #>   lung adenocarcinoma                             205      0           0   3274      0 #>   lung large cell carcinoma                         0      0           0      0      0 #>   lymphangioleiomyomatosis                          0      0           0      0      0 #>                                        tissue_general #> disease                                  colon kidney  liver   lung lymph node   nose #>   breast cancer                              0      0      0      0          0      0 #>   chronic obstructive pulmonary disease      0      0      0   9382          0      0 #>   chronic rhinitis                           0      0      0      0          0    909 #>   clear cell renal carcinoma                 0  20540      0      0         36      0 #>   COVID-19                                   0      0      0  30578          0     13 #>   Crohn disease                          17490      0      0      0          0      0 #>   cystic fibrosis                            0      0      0      7          0      0 #>   Down syndrome                              0      0      0      0          0      0 #>   follicular lymphoma                        0      0      0      0       1089      0 #>   influenza                                  0      0      0      0          0      0 #>   interstitial lung disease                  0      0      0   1803          0      0 #>   kidney benign neoplasm                     0     10      0      0          0      0 #>   kidney oncocytoma                          0   2303      0      0          0      0 #>   lung adenocarcinoma                        0      0    507 215013      24969      0 #>   lung large cell carcinoma                  0      0      0   5922          0      0 #>   lymphangioleiomyomatosis                   0      0      0    513          0      0 #>                                        tissue_general #> disease                                 pleural fluid respiratory system saliva #>   breast cancer                                     0                  0      0 #>   chronic obstructive pulmonary disease             0                  0      0 #>   chronic rhinitis                                  0                  0      0 #>   clear cell renal carcinoma                        0                  0      0 #>   COVID-19                                          0                  4     41 #>   Crohn disease                                     0                  0      0 #>   cystic fibrosis                                   0                  0      0 #>   Down syndrome                                     0                  0      0 #>   follicular lymphoma                               0                  0      0 #>   influenza                                         0                  0      0 #>   interstitial lung disease                         0                  0      0 #>   kidney benign neoplasm                            0                  0      0 #>   kidney oncocytoma                                 0                  0      0 #>   lung adenocarcinoma                           11558                  0      0 #>   lung large cell carcinoma                         0                  0      0 #>   lymphangioleiomyomatosis                          0                  0      0 #>                                        tissue_general #> disease                                 small intestine vasculature #>   breast cancer                                       0           0 #>   chronic obstructive pulmonary disease               0           0 #>   chronic rhinitis                                    0           0 #>   clear cell renal carcinoma                          0           0 #>   COVID-19                                            0           0 #>   Crohn disease                                   52029           0 #>   cystic fibrosis                                     0           0 #>   Down syndrome                                       0           0 #>   follicular lymphoma                                 0           0 #>   influenza                                           0           0 #>   interstitial lung disease                           0           0 #>   kidney benign neoplasm                              0           0 #>   kidney oncocytoma                                   0           0 #>   lung adenocarcinoma                                 0           0 #>   lung large cell carcinoma                           0           0 #>   lymphangioleiomyomatosis                            0           0 #>  [ reached getOption(\"max.print\") -- omitted 8 rows ]"},{"path":"/articles/comp_bio_data_integration.html","id":"finding-and-fetching-data-from-mouse-liver-10x-genomics-and-smart-seq2","dir":"Articles","previous_headings":"","what":"Finding and fetching data from mouse liver (10X Genomics and Smart-Seq2)","title":"Integrating multi-dataset slices of data with Seurat","text":"Let’s load packages needed notebook. Now can open Census. notebook use Tabula Muris Senis data liver contains cells 10X Genomics Smart-Seq2 technologies. Let’s query datasets table Census filtering collection_name “Tabula Muris Senis” dataset_title “liver”. Now can use values dataset_id query load Seurat object cells datasets. can check cell counts 10X Genomics Smart-Seq2 data looking assay metadata.","code":"library(\"cellxgene.census\") library(\"Seurat\") census <- open_soma() census_datasets <- census$get(\"census_info\")$get(\"datasets\") census_datasets <- census_datasets$read(value_filter = \"collection_name == 'Tabula Muris Senis'\") census_datasets <- as.data.frame(census_datasets$concat())  # Print rows with liver data census_datasets[grep(\"Liver\", census_datasets$dataset_title), ] #>    soma_joinid                        collection_id    collection_name #> 15         583 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis #> 36         605 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis #>               collection_doi                           dataset_id #> 15 10.1038/s41586-020-2496-1 4546e757-34d0-4d17-be06-538318925fcd #> 36 10.1038/s41586-020-2496-1 6202a243-b713-4e12-9ced-c387f8483dea #>                      dataset_version_id #> 15 0a851e26-a629-4e59-9b52-9b4d1ce4440b #> 36 70f4f091-86a9-44e3-a92a-54cee98cc223 #>                                                                                        dataset_title #> 15 Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - Smart-seq2 #> 36        Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - 10x #>                            dataset_h5ad_path dataset_total_cell_count #> 15 4546e757-34d0-4d17-be06-538318925fcd.h5ad                     2859 #> 36 6202a243-b713-4e12-9ced-c387f8483dea.h5ad                     7294 tabula_muris_liver_ids <- c(\"4546e757-34d0-4d17-be06-538318925fcd\", \"6202a243-b713-4e12-9ced-c387f8483dea\")  seurat_obj <- get_seurat(   census,   organism = \"Mus musculus\",   obs_value_filter = \"dataset_id %in% tabula_muris_liver_ids\" ) table(seurat_obj$assay) #>  #>  10x 3' v2 Smart-seq2  #>       7294       2859"},{"path":"/articles/comp_bio_data_integration.html","id":"gene-length-normalization-of-smart-seq2-data-","dir":"Articles","previous_headings":"","what":"Gene-length normalization of Smart-Seq2 data.","title":"Integrating multi-dataset slices of data with Seurat","text":"Smart-seq2 read counts normalized gene length. Lets first get gene lengths var.feature_length. Now can use normalize Smart-seq data. let’s split object assay. normalize Smart-seq slice using gene lengths merge back single object.","code":"smart_seq_gene_lengths <- seurat_obj$RNA[[]]$feature_length seurat_obj.list <- SplitObject(seurat_obj, split.by = \"assay\") seurat_obj.list[[\"Smart-seq2\"]][[\"RNA\"]]@counts <- seurat_obj.list[[\"Smart-seq2\"]][[\"RNA\"]]@counts / smart_seq_gene_lengths seurat_obj <- merge(seurat_obj.list[[1]], seurat_obj.list[[2]])"},{"path":"/articles/comp_bio_data_integration.html","id":"integration-with-seurat","dir":"Articles","previous_headings":"","what":"Integration with Seurat","title":"Integrating multi-dataset slices of data with Seurat","text":"use native integration capabilities Seurat. comprehensive usage best practices Seurat intergation please refer doc site Seurat.","code":""},{"path":"/articles/comp_bio_data_integration.html","id":"inspecting-data-prior-to-integration","dir":"Articles","previous_headings":"Integration with Seurat","what":"Inspecting data prior to integration","title":"Integrating multi-dataset slices of data with Seurat","text":"Let’s take look strength batch effects data. perform embedding visualization via UMAP. Let’s basic data normalization variable gene selection now perform PCA UMAP   can see batch effects strong cells cluster primarily assay cell_type. Properly integrated embedding principle cluster primarily cell_type, assay best randomly distributed.","code":"seurat_obj <- SCTransform(seurat_obj) seurat_obj <- FindVariableFeatures(seurat_obj, selection.method = \"vst\", nfeatures = 2000) seurat_obj <- RunPCA(seurat_obj, features = VariableFeatures(object = seurat_obj)) seurat_obj <- RunUMAP(seurat_obj, dims = 1:30) # By assay p1 <- DimPlot(seurat_obj, reduction = \"umap\", group.by = \"assay\") p1 # By cell type p2 <- DimPlot(seurat_obj, reduction = \"umap\", group.by = \"cell_type\") p2"},{"path":"/articles/comp_bio_data_integration.html","id":"data-integration-with-seurat","dir":"Articles","previous_headings":"Integration with Seurat","what":"Data integration with Seurat","title":"Integrating multi-dataset slices of data with Seurat","text":"Whenever query fetch Census data multiple datasets integration needs performed evidenced batch effects observed. paramaters Seurat used notebook selected model run quickly. best practices integration single-cell data using Seurat please refer documentation page. seurat_d reading article integrated cell atlas human lung health disease Sikkema et al. perfomed integration 43 datasets Lung. focus metadata Census can batch information integration.","code":""},{"path":"/articles/comp_bio_data_integration.html","id":"integration-across-datasets-using-dataset_id","dir":"Articles","previous_headings":"Integration with Seurat > Data integration with Seurat","what":"Integration across datasets using dataset_id","title":"Integrating multi-dataset slices of data with Seurat","text":"cells Census annotated dataset come \"dataset_id\". great place start integration. let’s run Seurat integration pipeline. First define model batch set dataset_id. Firs normalize select variable genes seperated batch key dataset_id Now perform integration. Let’s inspect results normalization UMAP visulization. plot UMAP.   Great! can see clustering longer mainly driven assay, albeit still contributing . Great! can see clustering longer mainly driven assay, albeit still contributing .","code":"# split the dataset into a list of two seurat objects for each dataset seurat_obj.list <- SplitObject(seurat_obj, split.by = \"dataset_id\")  # normalize each dataset independently seurat_obj.list <- lapply(X = seurat_obj.list, FUN = function(x) {   x <- SCTransform(x) })  # select features for integration features <- SelectIntegrationFeatures(object.list = seurat_obj.list) seurat_obj.list <- PrepSCTIntegration(seurat_obj.list, anchor.features = features) seurat_obj.anchors <- FindIntegrationAnchors(object.list = seurat_obj.list, anchor.features = features, normalization.method = \"SCT\") seurat_obj.combined <- IntegrateData(anchorset = seurat_obj.anchors, normalization.method = \"SCT\") DefaultAssay(seurat_obj.combined) <- \"integrated\"  # Run the standard workflow for visualization and clustering seurat_obj.combined <- ScaleData(seurat_obj.combined, verbose = FALSE) seurat_obj.combined <- RunPCA(seurat_obj.combined, npcs = 30, verbose = FALSE) seurat_obj.combined <- RunUMAP(seurat_obj.combined, reduction = \"pca\", dims = 1:30) # By assay p1 <- DimPlot(seurat_obj.combined, reduction = \"umap\", group.by = \"assay\") p1 # By cell type p2 <- DimPlot(seurat_obj.combined, reduction = \"umap\", group.by = \"cell_type\") p2"},{"path":"/articles/comp_bio_data_integration.html","id":"integration-across-datasets-using-dataset_id-and-controlling-for-batch-using-donor_id","dir":"Articles","previous_headings":"Integration with Seurat > Data integration with Seurat","what":"Integration across datasets using dataset_id and controlling for batch using donor_id","title":"Integrating multi-dataset slices of data with Seurat","text":"Similar dataset_id, cells Census annotated donor_id. definition donor_id depends dataset left discretion data curators. However still rich information can used batch variable integration. donor_id guaranteed unique across cells Census, strongly recommend concatenating dataset_id donor_id use batch separator Seurat Now perform integration. inspect new results UMAP. Plot UMAP.   can see using dataset_id donor_id batch cells now mostly cluster cell type.","code":"# split the dataset into a list of two seurat objects for each dataset seurat_obj.list <- SplitObject(seurat_obj, split.by = \"dataset_id\")  # normalize each dataset independently controlling for batch seurat_obj.list <- lapply(X = seurat_obj.list, FUN = function(x) {   x <- SCTransform(x, vars.to.regress = \"donor_id\") })  # select features for integration features <- SelectIntegrationFeatures(object.list = seurat_obj.list) seurat_obj.list <- PrepSCTIntegration(seurat_obj.list, anchor.features = features) seurat_obj.anchors <- FindIntegrationAnchors(object.list = seurat_obj.list, anchor.features = features, normalization.method = \"SCT\") #> Finding all pairwise anchors #> Running CCA #> Merging objects #> Finding neighborhoods #> Finding anchors #>  Found 7161 anchors #> Filtering anchors #>  Retained 4990 anchors seurat_obj.combined <- IntegrateData(anchorset = seurat_obj.anchors, normalization.method = \"SCT\") #> [1] 1 #> Warning: Different cells and/or features from existing assay SCT #> [1] 2 #> Warning: Different cells and/or features from existing assay SCT #> Merging dataset 1 into 2 #> Extracting anchors for merged samples #> Finding integration vectors #> Finding integration vector weights #> Integrating data #> Warning: Assay integrated changing from Assay to SCTAssay  #> Warning: Different cells and/or features from existing assay SCT DefaultAssay(seurat_obj.combined) <- \"integrated\"  # Run the standard workflow for visualization and clustering seurat_obj.combined <- RunPCA(seurat_obj.combined, npcs = 30, verbose = FALSE) seurat_obj.combined <- RunUMAP(seurat_obj.combined, reduction = \"pca\", dims = 1:30) #> 14:49:10 UMAP embedding parameters a = 0.9922 b = 1.112 #> 14:49:10 Read 10153 rows and found 30 numeric columns #> 14:49:10 Using Annoy for neighbor search, n_neighbors = 30 #> 14:49:10 Building Annoy index with metric = cosine, n_trees = 50 #> 0%   10   20   30   40   50   60   70   80   90   100% #> [----|----|----|----|----|----|----|----|----|----| #> **************************************************| #> 14:49:12 Writing NN index file to temp file /tmp/RtmpRa88jI/file926122f23120 #> 14:49:12 Searching Annoy index using 1 thread, search_k = 3000 #> 14:49:16 Annoy recall = 100% #> 14:49:16 Commencing smooth kNN distance calibration using 1 thread with target n_neighbors = 30 #> 14:49:17 Initializing from normalized Laplacian + noise (using RSpectra) #> 14:49:17 Commencing optimization for 200 epochs, with 409958 positive edges #> 14:49:21 Optimization finished # By assay p1 <- DimPlot(seurat_obj.combined, reduction = \"umap\", group.by = \"assay\") p1 # By cell type p2 <- DimPlot(seurat_obj.combined, reduction = \"umap\", group.by = \"cell_type\") p2"},{"path":"/articles/comp_bio_data_integration.html","id":"integration-across-datasets-using-dataset_id-and-controlling-for-batch-using-donor_id-assay_ontology_term_id-suspension_type-","dir":"Articles","previous_headings":"Integration with Seurat > Data integration with Seurat","what":"Integration across datasets using dataset_id and controlling for batch using donor_id + assay_ontology_term_id + suspension_type.","title":"Integrating multi-dataset slices of data with Seurat","text":"cases one dataset may contain multiple assay types /multiple suspension types (cell vs nucleus), important consider metadata batches. Therefore, comprehensive definition batch Census can accomplished combining cell metadata dataset_id, donor_id, assay_ontology_term_id suspension_type, latter encode EFO ids assay types. example, two datasets used contain cells one assay , one suspension type . Thus make difference include metadata part batch. implementation look line","code":"# EXAMPLE, DON'T RUN.  # split the dataset into a list of seurat objects for each dataset seurat_obj.list <- SplitObject(seurat_obj, split.by = \"dataset_id\")  # normalize each dataset independently controlling for batch seurat_obj.list <- lapply(X = seurat_obj.list, FUN = function(x) {   x <- SCTransform(x, vars.to.regress = c(\"donor_id\", \"assay_ontology_term_id\", \"suspension_type\")) })  # select features for integration features <- SelectIntegrationFeatures(object.list = seurat_obj.list)  # integrate seurat_obj.list <- PrepSCTIntegration(seurat_obj.list, anchor.features = features) seurat_obj.anchors <- FindIntegrationAnchors(object.list = seurat_obj.list, anchor.features = features, normalization.method = \"SCT\") seurat_obj.combined <- IntegrateData(anchorset = seurat_obj.anchors, normalization.method = \"SCT\")"},{"path":"/articles/comp_bio_normalizing_full_gene_sequencing.html","id":"opening-the-census","dir":"Articles","previous_headings":"","what":"Opening the census","title":"Normalizing full-length gene sequencing data","text":"First open Census: can learn cellxgene.census methods accessing corresponding documentation, example ?cellxgene.census::open_soma.","code":"library(\"Seurat\") census <- cellxgene.census::open_soma()"},{"path":"/articles/comp_bio_normalizing_full_gene_sequencing.html","id":"fetching-full-length-example-sequencing-data-smart-seq","dir":"Articles","previous_headings":"","what":"Fetching full-length example sequencing data (Smart-Seq)","title":"Normalizing full-length gene sequencing data","text":"Let’s get example data, case ’ll fetch cells relatively small dataset derived Smart-Seq2 technology performs full-length gene sequencing: Collection: Tabula Muris Senis Dataset: Liver - single-cell transcriptomic atlas characterizes ageing tissues mouse - Smart-seq2 Let’s first find dataset’s id using dataset table Census. Now can use id fetch data. Let’s make sure data contains Smart-Seq2 cells. Great! can see small dataset containing 2,859 cells. Now let’s proceed normalize gene lengths.","code":"liver_dataset <- as.data.frame(   census$get(\"census_info\")$get(\"datasets\")         $read(value_filter=\"dataset_title == 'Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - Smart-seq2'\")         $concat() ) liver_dataset #>   soma_joinid                        collection_id    collection_name #> 1         583 0b9d8a04-bb9d-44da-aa27-705bb65b54eb Tabula Muris Senis #>              collection_doi                           dataset_id #> 1 10.1038/s41586-020-2496-1 4546e757-34d0-4d17-be06-538318925fcd #>                     dataset_version_id #> 1 0a851e26-a629-4e59-9b52-9b4d1ce4440b #>                                                                                       dataset_title #> 1 Liver - A single-cell transcriptomic atlas characterizes ageing tissues in the mouse - Smart-seq2 #>                           dataset_h5ad_path dataset_total_cell_count #> 1 4546e757-34d0-4d17-be06-538318925fcd.h5ad                     2859 liver_dataset_id <- liver_dataset[1,\"dataset_id\"] liver_seurat <- cellxgene.census::get_seurat(   census,   organism = \"Mus musculus\",   obs_value_filter = paste0(\"dataset_id == '\", liver_dataset_id, \"'\") ) table(liver_seurat$assay) #>  #> Smart-seq2  #>       2859"},{"path":"/articles/comp_bio_normalizing_full_gene_sequencing.html","id":"normalizing-expression-to-account-for-gene-length","dir":"Articles","previous_headings":"","what":"Normalizing expression to account for gene length","title":"Normalizing full-length gene sequencing data","text":"default cellxgene_census::get_seurat() fetches genes Census. let’s first identify genes measured dataset subset Seurat obect include . goal can use “Dataset Presence Matrix” census$get(\"census_data\")$get(\"mus_musculus\")$ms$get(\"RNA\")$get(\"feature_dataset_presence_matrix\"). boolean matrix N x M N number datasets, M number genes Census, 1 entry indicates gene measured dataset. (Note Seurat objects transposed layout M x N.) Let’s get genes measured dataset. can see genes Census 17,992 measured dataset. Now let’s normalize genes gene length. can easily Census gene lengths included gene metadata feature_length. done! can now see real numbers instead integers.","code":"liver_seurat #> An object of class Seurat  #> 52417 features across 2859 samples within 1 assay  #> Active assay: RNA (52417 features, 0 variable features) #>  2 layers present: counts, data liver_dataset_joinid <- liver_dataset$soma_joinid[1] presence_matrix <- cellxgene.census::get_presence_matrix(census, \"Mus musculus\", \"RNA\") presence_matrix <- presence_matrix$take(liver_dataset_joinid) gene_presence <- as.vector(presence_matrix$get_one_based_matrix())  liver_seurat <- liver_seurat[gene_presence, ] liver_seurat #> An object of class Seurat  #> 17992 features across 2859 samples within 1 assay  #> Active assay: RNA (17992 features, 0 variable features) #>  2 layers present: counts, data GetAssayData(liver_seurat[1:5, 1:5], slot = \"data\") #> Warning: The `slot` argument of `GetAssayData()` is deprecated as of SeuratObject 5.0.0. #> ℹ Please use the `layer` argument instead. #> This warning is displayed once every 8 hours. #> Call `lifecycle::last_lifecycle_warnings()` to see where this warning was generated. #> 5 x 5 sparse Matrix of class \"dgCMatrix\" #>                    cell3959639 cell3959640 cell3959641 cell3959642 cell3959643 #> ENSMUSG00000025900           .           .           .           .           . #> ENSMUSG00000025902           .           .           .           .        2250 #> ENSMUSG00000033845           .         559        1969           .           . #> ENSMUSG00000025903           .           .           .           .           . #> ENSMUSG00000033813           .           .         828           1          54 gene_lengths <- liver_seurat$RNA@meta.features$feature_length liver_seurat <- SetAssayData(   liver_seurat,    new.data = sweep(GetAssayData(liver_seurat, slot = \"data\"), 1, gene_lengths, \"/\") ) GetAssayData(liver_seurat[1:5, 1:5], slot = \"data\") #> 5 x 5 sparse Matrix of class \"dgCMatrix\" #>                    cell3959639 cell3959640 cell3959641  cell3959642 cell3959643 #> ENSMUSG00000025900           .  .            .         .             .          #> ENSMUSG00000025902           .  .            .         .             0.47150042 #> ENSMUSG00000033845           .  0.06586544   0.2320019 .             .          #> ENSMUSG00000025903           .  .            .         .             .          #> ENSMUSG00000033813           .  .            0.2744448 0.0003314551  0.01789857"},{"path":"/articles/comp_bio_normalizing_full_gene_sequencing.html","id":"validation-through-clustering-exploration","dir":"Articles","previous_headings":"","what":"Validation through clustering exploration","title":"Normalizing full-length gene sequencing data","text":"Let’s perform basic clustering analysis see cell types cluster expected using normalized counts. First basic filtering cells genes. normalize account sequencing depth transform data log scale. subset highly variable genes. finally scale values across gene axis. Now can proceed clustering analysis.  exceptions can see cells cell type cluster near serves sanity check gene-length normalization applied. Don’t forget close census.","code":"cells_per_gene <- rowSums(GetAssayData(liver_seurat, slot = \"counts\") > 0) genes_per_cell <- Matrix::colSums(liver_seurat$RNA@counts > 0) liver_seurat <- liver_seurat[cells_per_gene >= 5, genes_per_cell >= 500] liver_seurat <- Seurat::NormalizeData(   liver_seurat,   normalization.method = \"LogNormalize\",   scale.factor = 10000 ) liver_seurat <- Seurat::FindVariableFeatures(   liver_seurat,   selection.method = \"vst\",   nfeatures = 1000 ) all.genes <- rownames(liver_seurat) liver_seurat <- Seurat::ScaleData(liver_seurat, features = all.genes) liver_seurat <- RunPCA(   liver_seurat,   features = VariableFeatures(object = liver_seurat) ) liver_seurat <- FindNeighbors(liver_seurat, dims = 1:40) liver_seurat <- RunUMAP(liver_seurat, dims = 1:40) DimPlot(liver_seurat, reduction = \"umap\", group.by = \"cell_type\") census$close()"},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"opening-the-census","dir":"Articles","previous_headings":"","what":"Opening the Census","title":"Summarizing cell and gene metadata","text":"cellxgene.census R package contains convenient API open version Census (default, newest stable version). open Census, close census$close(). can automated using .exit(census$close(), add = TRUE) immediately census <- open_soma(). can learn cellxgene.census methods accessing corresponding documentation. example ?cellxgene.census::open_soma.","code":"library(\"cellxgene.census\") census <- open_soma()"},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"summarizing-cell-metadata","dir":"Articles","previous_headings":"","what":"Summarizing cell metadata","title":"Summarizing cell and gene metadata","text":"Census open can use TileDB-SOMA methods SOMACollection. can thus access metadata SOMADataFrame objects encoding cell gene metadata. Tips: can read entire SOMADataFrame R using .data.frame(soma_df$read()$concat()). Queries much faster request DataFrame columns required analysis (e.g. column_names = c(\"soma_joinid\", \"cell_type_ontology_term_id\")). can also refine query results using value_filter, filter census matching records.","code":""},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"example-summarize-all-cell-types","dir":"Articles","previous_headings":"Summarizing cell metadata","what":"Example: Summarize all cell types","title":"Summarizing cell and gene metadata","text":"example reads cell metadata (obs) R data frame summarize variety ways.","code":"human <- census$get(\"census_data\")$get(\"homo_sapiens\")  # Read obs into an R data frame (tibble). obs_df <- human$obs$read(column_names = c(\"cell_type\")) obs_df <- as.data.frame(obs_df$concat())  # Find all unique values in the cell_type column. unique_cell_type <- unique(obs_df$cell_type)  cat(   \"There are\",   length(unique_cell_type),   \"cell types in the Census! The first few are: \",   paste(head(unique_cell_type), collapse = \", \") ) #> There are 631 cell types in the Census! The first few are:  oligodendrocyte, oligodendrocyte precursor cell, astrocyte of the cerebral cortex, microglial cell, cerebral cortex endothelial cell, vascular leptomeningeal cell"},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"example-summarize-a-subset-of-cell-types-selected-with-a-value_filter","dir":"Articles","previous_headings":"Summarizing cell metadata","what":"Example: Summarize a subset of cell types, selected with a value_filter","title":"Summarizing cell and gene metadata","text":"example utilizes SOMA “value filter” read subset cells tissue_ontology_term_id equal UBERON:0002048 (lung tissue), summarizes query result. can also define much complex value filters. example: combine terms & | use %% operator query multiple values","code":"# Read cell_type terms for cells which have a specific tissue term LUNG_TISSUE <- \"UBERON:0002048\"  obs_df <- human$obs$read(column_names = c(\"cell_type\"), value_filter = paste0(\"tissue_ontology_term_id == '\", LUNG_TISSUE, \"'\")) obs_df <- as.data.frame(obs_df$concat())  # Find all unique values in the cell_type column as an R data frame. unique_cell_type <- unique(obs_df$cell_type) cat(   \"There are \",   length(unique_cell_type),   \" cell types in the Census where tissue_ontology_term_id == \",   LUNG_TISSUE,   \"!\\nThe first few are:\",   paste(head(unique_cell_type), collapse = \", \"),   \"\\n\" ) #> There are  185  cell types in the Census where tissue_ontology_term_id ==  UBERON:0002048 ! #> The first few are: type II pneumocyte, neutrophil, effector CD4-positive, alpha-beta T cell, effector CD8-positive, alpha-beta T cell, mature NK T cell, blood vessel endothelial cell  # Report the 10 most common top_10 <- sort(table(obs_df$cell_type), decreasing = TRUE)[1:10] cat(   \"The top 10 cell types where tissue_ontology_term_id ==\",    LUNG_TISSUE,   \"are: \",   paste(names(top_10), collapse = \", \") ) #> The top 10 cell types where tissue_ontology_term_id == UBERON:0002048 are:  native cell, alveolar macrophage, CD8-positive, alpha-beta T cell, CD4-positive, alpha-beta T cell, macrophage, type II pneumocyte, classical monocyte, natural killer cell, malignant cell, epithelial cell of lower respiratory tract # You can also do more complex queries, such as testing for inclusion in a list of values obs_df <- human$obs$read(   column_names = c(\"cell_type_ontology_term_id\"),   value_filter = \"tissue_ontology_term_id %in% c('UBERON:0002082', 'UBERON:OOO2084', 'UBERON:0002080')\" )  obs_df <- as.data.frame(obs_df$concat())  # Summarize top_10 <- sort(table(obs_df$cell_type_ontology_term_id), decreasing = TRUE)[1:10] print(top_10) #>  #> CL:0000746 CL:0008034 CL:0002131 CL:0002548 CL:0000115 CL:0000763 CL:0000057 CL:0000669  #>     160974      99458      96953      79733      79626      35560      33075      27515  #> CL:0000003 CL:0002144  #>      23613      18593"},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"full-census-metadata-stats","dir":"Articles","previous_headings":"","what":"Full Census metadata stats","title":"Summarizing cell and gene metadata","text":"example queries organisms Census, summarizes diversity various metadata labels.","code":"cols_to_query <- c(   \"cell_type_ontology_term_id\",   \"assay_ontology_term_id\",   \"tissue_ontology_term_id\" )  total_cells <- 0 for (organism in census$get(\"census_data\")$names()) {   print(organism)      obs_df <- census$get(\"census_data\")$get(organism)$obs$read(column_names = cols_to_query)   obs_df <- as.data.frame(obs_df$concat())      total_cells <- total_cells + nrow(obs_df)   for (col in cols_to_query) {     cat(\"  Unique \", col, \" values: \", length(unique(obs_df[[col]])), \"\\n\")   } } #> [1] \"homo_sapiens\" #>   Unique  cell_type_ontology_term_id  values:  631  #>   Unique  assay_ontology_term_id  values:  20  #>   Unique  tissue_ontology_term_id  values:  230  #> [1] \"mus_musculus\" #>   Unique  cell_type_ontology_term_id  values:  248  #>   Unique  assay_ontology_term_id  values:  10  #>   Unique  tissue_ontology_term_id  values:  74 cat(\"Complete Census contains \", total_cells, \" cells.\") #> Complete Census contains  68683222  cells."},{"path":"/articles/comp_bio_summarize_axis_query.html","id":"close-the-census","dir":"Articles","previous_headings":"Full Census metadata stats","what":"Close the census","title":"Summarizing cell and gene metadata","text":"use, census object closed release memory resources. also closes SOMA objects accessed via top-level census. Closing can automated using .exit(census$close(), add = TRUE) immediately census <- open_soma().","code":"census$close()"},{"path":"/authors.html","id":null,"dir":"","previous_headings":"","what":"Authors","title":"Authors and Citation","text":"Chan Zuckerberg Initiative Foundation. Author, maintainer, copyright holder, funder.","code":""},{"path":"/authors.html","id":"citation","dir":"","previous_headings":"","what":"Citation","title":"Authors and Citation","text":"Chan Zuckerberg Initiative Foundation (2024). cellxgene.census: CZ CELLxGENE Discover Cell Census. R package version 1.9.1, https://github.com/chanzuckerberg/cellxgene-census.","code":"@Manual{,   title = {cellxgene.census: CZ CELLxGENE Discover Cell Census},   author = {{Chan Zuckerberg Initiative Foundation}},   year = {2024},   note = {R package version 1.9.1},   url = {https://github.com/chanzuckerberg/cellxgene-census}, }"},{"path":"/index.html","id":"r-package-of-cz-cellxgene-discover-census","dir":"","previous_headings":"","what":"CZ CELLxGENE Discover Cell Census","title":"CZ CELLxGENE Discover Cell Census","text":"documentation R package cellxgene.census part CZ CELLxGENE Discover Census. full details Census data capabilities please go main Census site. cellxgene.census provides API efficiently access cloud-hosted Census single-cell data R. just seconds users can access slice Census data using cell gene filters across hundreds single-cell datasets. Census data can fetched iterative fashion bigger--memory slices data, quickly exported basic R structures, well Seurat SingleCellExperiment objects downstream analysis.","code":""},{"path":"/index.html","id":"installation","dir":"","previous_headings":"","what":"Installation","title":"CZ CELLxGENE Discover Cell Census","text":"installing Ubuntu, may need install following libraries via apt install, libxml2-dev libssl-dev libcurl4-openssl-dev. addition must cmake v3.21 greater. installing MacOS, need install developer tools Xcode. Windows supported. R session install cellxgene.census R-Universe. able export Census data Seurat SingleCellExperiment also need install respective packages.","code":"install.packages(   \"cellxgene.census\",   repos=c('https://chanzuckerberg.r-universe.dev', 'https://cloud.r-project.org') ) # Seurat install.packages(\"Seurat\")  # SingleCellExperiment if (!require(\"BiocManager\", quietly = TRUE))     install.packages(\"BiocManager\")  BiocManager::install(\"SingleCellExperiment\")"},{"path":"/index.html","id":"usage","dir":"","previous_headings":"","what":"Usage","title":"CZ CELLxGENE Discover Cell Census","text":"Check vignettes “Articles” section navigation bar site. highly recommend following vignettes starting point: Querying fetching single-cell data cell/gene metadata Learning CZ CELLxGENE Discover Census can also check quick start guide main Census site.","code":""},{"path":"/index.html","id":"example-seurat-and-singlecellexperiment-query","dir":"","previous_headings":"Usage","what":"Example Seurat and SingleCellExperiment query","title":"CZ CELLxGENE Discover Cell Census","text":"following creates Seurat object -demand sympathetic neurons Census filtering genes ENSG00000161798, ENSG00000188229. following retrieves data SingleCellExperiment object.","code":"library(\"cellxgene.census\") library(\"Seurat\")  census <- open_soma()  organism <- \"Homo sapiens\" gene_filter <- \"feature_id %in% c('ENSG00000107317', 'ENSG00000106034')\" cell_filter <-  \"cell_type == 'sympathetic neuron'\" cell_columns <- c(\"assay\", \"cell_type\", \"tissue\", \"tissue_general\", \"suspension_type\", \"disease\")  seurat_obj <- get_seurat(    census = census,    organism = organism,    var_value_filter = gene_filter,    obs_value_filter = cell_filter,    obs_column_names = cell_columns ) library(\"SingleCellExperiment\")  sce_obj <- get_single_cell_experiment(    census = census,    organism = organism,    var_value_filter = gene_filter,    obs_value_filter = cell_filter,    obs_column_names = cell_columns )"},{"path":"/index.html","id":"for-more-help","dir":"","previous_headings":"","what":"For More Help","title":"CZ CELLxGENE Discover Cell Census","text":"help, please go visit main Census site. believe found security issue, appreciate notification. Please send email security@chanzuckerberg.com.","code":""},{"path":"/reference/download_source_h5ad.html","id":null,"dir":"Reference","previous_headings":"","what":"Download source H5AD to local file name. — download_source_h5ad","title":"Download source H5AD to local file name. — download_source_h5ad","text":"Download source H5AD local file name.","code":""},{"path":"/reference/download_source_h5ad.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Download source H5AD to local file name. — download_source_h5ad","text":"","code":"download_source_h5ad(   dataset_id,   file,   overwrite = FALSE,   census_version = \"stable\",   census = NULL )"},{"path":"/reference/download_source_h5ad.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Download source H5AD to local file name. — download_source_h5ad","text":"dataset_id dataset_id interest. file Local file name store H5AD file. overwrite TRUE allow overwriting existing file. census_version desired Census version. census open Census handle census_version. provided, opened closed automatically; efficient reuse handle calling download_source_h5ad() multiple times.","code":""},{"path":"/reference/download_source_h5ad.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Download source H5AD to local file name. — download_source_h5ad","text":"","code":"download_source_h5ad(\"0895c838-e550-48a3-a777-dbcd35d30272\", \"/tmp/data.h5ad\", overwrite = TRUE)"},{"path":"/reference/get_census_version_description.html","id":null,"dir":"Reference","previous_headings":"","what":"Get release description for a Census version — get_census_version_description","title":"Get release description for a Census version — get_census_version_description","text":"Get release description Census version","code":""},{"path":"/reference/get_census_version_description.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Get release description for a Census version — get_census_version_description","text":"","code":"get_census_version_description(census_version)"},{"path":"/reference/get_census_version_description.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Get release description for a Census version — get_census_version_description","text":"census_version census version name.","code":""},{"path":"/reference/get_census_version_description.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Get release description for a Census version — get_census_version_description","text":"List release location metadata","code":""},{"path":"/reference/get_census_version_description.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Get release description for a Census version — get_census_version_description","text":"","code":"as.data.frame(get_census_version_description(\"stable\")) #>   release_date release_build #> 1                 2023-12-15 #>                                                              soma.uri #> 1 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/ #>               soma.relative_uri soma.s3_region #> 1 /cell-census/2023-12-15/soma/      us-west-2 #>                                                              h5ads.uri #> 1 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/h5ads/ #>               h5ads.relative_uri h5ads.s3_region do_not_delete  lts  alias #> 1 /cell-census/2023-12-15/h5ads/       us-west-2          TRUE TRUE stable #>   census_version #> 1         stable"},{"path":"/reference/get_census_version_directory.html","id":null,"dir":"Reference","previous_headings":"","what":"Get the directory of Census releases currently available — get_census_version_directory","title":"Get the directory of Census releases currently available — get_census_version_directory","text":"Get directory Census releases currently available","code":""},{"path":"/reference/get_census_version_directory.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Get the directory of Census releases currently available — get_census_version_directory","text":"","code":"get_census_version_directory()"},{"path":"/reference/get_census_version_directory.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Get the directory of Census releases currently available — get_census_version_directory","text":"Data frame available cell census releases, including location metadata.","code":""},{"path":"/reference/get_census_version_directory.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Get the directory of Census releases currently available — get_census_version_directory","text":"","code":"get_census_version_directory() #>            release_date release_build #> stable                     2023-12-15 #> latest                     2024-01-01 #> 2023-05-15                 2023-05-15 #> 2023-07-25                 2023-07-25 #> 2023-10-23                 2023-10-23 #> 2023-12-11                 2023-12-11 #> 2023-12-15                 2023-12-15 #> 2023-12-18                 2023-12-18 #> 2023-12-21                 2023-12-21 #> 2023-12-25                 2023-12-25 #> 2024-01-01                 2024-01-01 #>                                                                       soma.uri #> stable     s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/ #> latest     s3://cellxgene-census-public-us-west-2/cell-census/2024-01-01/soma/ #> 2023-05-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-05-15/soma/ #> 2023-07-25 s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/soma/ #> 2023-10-23 s3://cellxgene-census-public-us-west-2/cell-census/2023-10-23/soma/ #> 2023-12-11 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-11/soma/ #> 2023-12-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/ #> 2023-12-18 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-18/soma/ #> 2023-12-21 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-21/soma/ #> 2023-12-25 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-25/soma/ #> 2024-01-01 s3://cellxgene-census-public-us-west-2/cell-census/2024-01-01/soma/ #>                        soma.relative_uri soma.s3_region #> stable     /cell-census/2023-12-15/soma/      us-west-2 #> latest     /cell-census/2024-01-01/soma/      us-west-2 #> 2023-05-15 /cell-census/2023-05-15/soma/      us-west-2 #> 2023-07-25 /cell-census/2023-07-25/soma/      us-west-2 #> 2023-10-23 /cell-census/2023-10-23/soma/      us-west-2 #> 2023-12-11 /cell-census/2023-12-11/soma/      us-west-2 #> 2023-12-15 /cell-census/2023-12-15/soma/      us-west-2 #> 2023-12-18 /cell-census/2023-12-18/soma/      us-west-2 #> 2023-12-21 /cell-census/2023-12-21/soma/      us-west-2 #> 2023-12-25 /cell-census/2023-12-25/soma/      us-west-2 #> 2024-01-01 /cell-census/2024-01-01/soma/      us-west-2 #>                                                                       h5ads.uri #> stable     s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/h5ads/ #> latest     s3://cellxgene-census-public-us-west-2/cell-census/2024-01-01/h5ads/ #> 2023-05-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-05-15/h5ads/ #> 2023-07-25 s3://cellxgene-census-public-us-west-2/cell-census/2023-07-25/h5ads/ #> 2023-10-23 s3://cellxgene-census-public-us-west-2/cell-census/2023-10-23/h5ads/ #> 2023-12-11 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-11/h5ads/ #> 2023-12-15 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/h5ads/ #> 2023-12-18 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-18/h5ads/ #> 2023-12-21 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-21/h5ads/ #> 2023-12-25 s3://cellxgene-census-public-us-west-2/cell-census/2023-12-25/h5ads/ #> 2024-01-01 s3://cellxgene-census-public-us-west-2/cell-census/2024-01-01/h5ads/ #>                        h5ads.relative_uri h5ads.s3_region do_not_delete   lts #> stable     /cell-census/2023-12-15/h5ads/       us-west-2          TRUE  TRUE #> latest     /cell-census/2024-01-01/h5ads/       us-west-2         FALSE    NA #> 2023-05-15 /cell-census/2023-05-15/h5ads/       us-west-2          TRUE  TRUE #> 2023-07-25 /cell-census/2023-07-25/h5ads/       us-west-2          TRUE  TRUE #> 2023-10-23 /cell-census/2023-10-23/h5ads/       us-west-2         FALSE FALSE #> 2023-12-11 /cell-census/2023-12-11/h5ads/       us-west-2         FALSE    NA #> 2023-12-15 /cell-census/2023-12-15/h5ads/       us-west-2          TRUE  TRUE #> 2023-12-18 /cell-census/2023-12-18/h5ads/       us-west-2         FALSE    NA #> 2023-12-21 /cell-census/2023-12-21/h5ads/       us-west-2         FALSE    NA #> 2023-12-25 /cell-census/2023-12-25/h5ads/       us-west-2         FALSE    NA #> 2024-01-01 /cell-census/2024-01-01/h5ads/       us-west-2         FALSE    NA #>             alias #> stable     stable #> latest     latest #> 2023-05-15        #> 2023-07-25        #> 2023-10-23        #> 2023-12-11        #> 2023-12-15        #> 2023-12-18        #> 2023-12-21        #> 2023-12-25        #> 2024-01-01"},{"path":"/reference/get_presence_matrix.html","id":null,"dir":"Reference","previous_headings":"","what":"Read the feature dataset presence matrix. — get_presence_matrix","title":"Read the feature dataset presence matrix. — get_presence_matrix","text":"Read feature dataset presence matrix.","code":""},{"path":"/reference/get_presence_matrix.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Read the feature dataset presence matrix. — get_presence_matrix","text":"","code":"get_presence_matrix(census, organism, measurement_name = \"RNA\")"},{"path":"/reference/get_presence_matrix.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Read the feature dataset presence matrix. — get_presence_matrix","text":"census census object cellxgene.census::open_soma(). organism organism query, usually one Homo sapiens Mus musculus measurement_name measurement object query. Defaults RNA.","code":""},{"path":"/reference/get_presence_matrix.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Read the feature dataset presence matrix. — get_presence_matrix","text":"tiledbsoma::matrixZeroBasedView object dataset join id & feature join id dimensions, filled 1s indicating presence. sparse matrix accessed zero-based indexes since join id's may zero.","code":""},{"path":"/reference/get_presence_matrix.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Read the feature dataset presence matrix. — get_presence_matrix","text":"","code":"census <- open_soma() #> The stable Census release is currently 2023-12-15. Specify census_version = \"2023-12-15\" in future calls to open_soma() to ensure data consistency. on.exit(census$close(), add = TRUE) print(get_presence_matrix(census, \"Homo sapiens\")$dim()) #> Error in private$check_open_for_read_or_write(): Item must be open for read or write. s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/soma/"},{"path":"/reference/get_seurat.html","id":null,"dir":"Reference","previous_headings":"","what":"Export Census slices to Seurat — get_seurat","title":"Export Census slices to Seurat — get_seurat","text":"Convenience wrapper around SOMAExperimentAxisQuery, build execute query, return Seurat object.","code":""},{"path":"/reference/get_seurat.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Export Census slices to Seurat — get_seurat","text":"","code":"get_seurat(   census,   organism,   measurement_name = \"RNA\",   X_layers = c(counts = \"raw\", data = NULL),   obs_value_filter = NULL,   obs_coords = NULL,   obs_column_names = NULL,   obsm_layers = FALSE,   var_value_filter = NULL,   var_coords = NULL,   var_column_names = NULL,   var_index = \"feature_id\" )"},{"path":"/reference/get_seurat.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Export Census slices to Seurat — get_seurat","text":"census census object, usually returned cellxgene.census::open_soma(). organism organism query, usually one Homo sapiens Mus musculus measurement_name measurement object query. Defaults RNA. X_layers named character X layers add Seurat assay, names names Seurat slots (counts data) values names layers within X. obs_value_filter SOMA value_filter across columns obs dataframe, expressed string. obs_coords set coordinates obs dataframe index, expressed type format supported SOMADataFrame's read() method. obs_column_names Columns fetch obs data frame. obsm_layers Names arrays obsm add cell embeddings; pass FALSE suppress loading dimensional reductions. var_value_filter obs_value_filter var. var_coords obs_coords var. var_column_names Columns fetch var data frame. var_index Name column ‘var’ add feature names.","code":""},{"path":"/reference/get_seurat.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Export Census slices to Seurat — get_seurat","text":"Seurat object containing sensus slice.","code":""},{"path":"/reference/get_seurat.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Export Census slices to Seurat — get_seurat","text":"","code":"if (FALSE) { census <- open_soma() seurat_obj <- get_seurat(   census,   organism = \"Homo sapiens\",   obs_value_filter = \"cell_type == 'leptomeningeal cell'\",   var_value_filter = \"feature_id %in% c('ENSG00000107317', 'ENSG00000106034')\" )  seurat_obj  census$close() }"},{"path":"/reference/get_single_cell_experiment.html","id":null,"dir":"Reference","previous_headings":"","what":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","title":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","text":"Convenience wrapper around SOMAExperimentAxisQuery, build execute query, return SingleCellExperiment object.","code":""},{"path":"/reference/get_single_cell_experiment.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","text":"","code":"get_single_cell_experiment(   census,   organism,   measurement_name = \"RNA\",   X_layers = c(counts = \"raw\"),   obs_value_filter = NULL,   obs_coords = NULL,   obs_column_names = NULL,   obsm_layers = FALSE,   var_value_filter = NULL,   var_coords = NULL,   var_column_names = NULL,   var_index = \"feature_id\" )"},{"path":"/reference/get_single_cell_experiment.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","text":"census census object, usually returned cellxgene.census::open_soma(). organism organism query, usually one Homo sapiens Mus musculus measurement_name measurement object query. Defaults RNA. X_layers character vector X layers add assays main experiment; may optionally named set name resulting assay (eg. ‘X_layers = c(counts = \"raw\")’ load X layer “‘raw’” assay “‘counts’”); default, loads X layers obs_value_filter SOMA value_filter across columns obs dataframe, expressed string. obs_coords set coordinates obs dataframe index, expressed type format supported SOMADataFrame's read() method. obs_column_names Columns fetch obs data frame. obsm_layers Names arrays obsm add cell embeddings; pass FALSE suppress loading dimensional reductions. var_value_filter obs_value_filter var. var_coords obs_coords var. var_column_names Columns fetch var data frame. var_index Name column ‘var’ add feature names.","code":""},{"path":"/reference/get_single_cell_experiment.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","text":"SingleCellExperiment object containing sensus slice.","code":""},{"path":"/reference/get_single_cell_experiment.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Export Census slices to SingleCellExperiment — get_single_cell_experiment","text":"","code":"if (FALSE) { census <- open_soma() sce_obj <- get_single_cell_experiment(   census,   organism = \"Homo sapiens\",   obs_value_filter = \"cell_type == 'leptomeningeal cell'\",   var_value_filter = \"feature_id %in% c('ENSG00000107317', 'ENSG00000106034')\" )  sce_obj  census$close() }"},{"path":"/reference/get_source_h5ad_uri.html","id":null,"dir":"Reference","previous_headings":"","what":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","title":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","text":"Locate source h5ad file dataset.","code":""},{"path":"/reference/get_source_h5ad_uri.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","text":"","code":"get_source_h5ad_uri(dataset_id, census_version = \"stable\", census = NULL)"},{"path":"/reference/get_source_h5ad_uri.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","text":"dataset_id dataset_id interest. census_version desired Census version. census open Census handle census_version. provided, opened closed automatically; efficient reuse handle calling get_source_h5ad_uri() multiple times.","code":""},{"path":"/reference/get_source_h5ad_uri.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","text":"list uri optional s3_region.","code":""},{"path":"/reference/get_source_h5ad_uri.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Locate source h5ad file for a dataset. — get_source_h5ad_uri","text":"","code":"get_source_h5ad_uri(\"0895c838-e550-48a3-a777-dbcd35d30272\") #> $uri #> [1] \"s3://cellxgene-census-public-us-west-2/cell-census/2023-12-15/h5ads/0895c838-e550-48a3-a777-dbcd35d30272.h5ad\" #>  #> $s3_region #> [1] \"us-west-2\" #>"},{"path":"/reference/new_SOMATileDBContext_for_census.html","id":null,"dir":"Reference","previous_headings":"","what":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","title":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","text":"Create SOMATileDBContext suitable using open_soma(). Typically open_soma() creates context automatically, one can created separately order set custom configuration options, share multiple open Census handles.","code":""},{"path":"/reference/new_SOMATileDBContext_for_census.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","text":"","code":"new_SOMATileDBContext_for_census(   census_version_description,   mirror = \"default\",   ... )"},{"path":"/reference/new_SOMATileDBContext_for_census.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","text":"census_version_description result get_census_version_description() desired Census version. mirror name intended census mirror (get_census_mirror_directory()[[name]] save lookup), NULL configure local file access. ... Custom configuration options.","code":""},{"path":"/reference/new_SOMATileDBContext_for_census.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","text":"SOMATileDBContext object open_soma().","code":""},{"path":"/reference/new_SOMATileDBContext_for_census.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Create SOMATileDBContext for Census — new_SOMATileDBContext_for_census","text":"","code":"census_desc <- get_census_version_description(\"stable\") ctx <- new_SOMATileDBContext_for_census(census_desc, \"soma.init_buffer_bytes\" = paste(4 * 1024**3)) census <- open_soma(\"stable\", tiledbsoma_ctx = ctx) #> The stable Census release is currently 2023-12-15. Specify census_version = \"2023-12-15\" in future calls to open_soma() to ensure data consistency. census$close()"},{"path":"/reference/open_soma.html","id":null,"dir":"Reference","previous_headings":"","what":"Open the Census — open_soma","title":"Open the Census — open_soma","text":"Open Census","code":""},{"path":"/reference/open_soma.html","id":"ref-usage","dir":"Reference","previous_headings":"","what":"Usage","title":"Open the Census — open_soma","text":"","code":"open_soma(   census_version = \"stable\",   uri = NULL,   tiledbsoma_ctx = NULL,   mirror = NULL )"},{"path":"/reference/open_soma.html","id":"arguments","dir":"Reference","previous_headings":"","what":"Arguments","title":"Open the Census — open_soma","text":"census_version version Census, e.g., \"stable\". uri URI containing Census SOMA objects open instead released version. (supplied, takes precedence census_version.) tiledbsoma_ctx tiledbsoma::SOMATileDBContext built using new_SOMATileDBContext_for_census(). Optional (created automatically) using census_version context need reused. mirror Census mirror access; one names(get_census_mirror_directory()).","code":""},{"path":"/reference/open_soma.html","id":"value","dir":"Reference","previous_headings":"","what":"Value","title":"Open the Census — open_soma","text":"Top-level tiledbsoma::SOMACollection object. use, census closed release memory resources, usually .exit(census$close(), add = TRUE). Closing top-level census also close SOMA objects accessed .","code":""},{"path":"/reference/open_soma.html","id":"ref-examples","dir":"Reference","previous_headings":"","what":"Examples","title":"Open the Census — open_soma","text":"","code":"census <- open_soma() #> The stable Census release is currently 2023-12-15. Specify census_version = \"2023-12-15\" in future calls to open_soma() to ensure data consistency. as.data.frame(census$get(\"census_info\")$get(\"summary\")$read()$concat()) #>   soma_joinid                      label      value #> 1           0      census_schema_version      1.2.0 #> 2           1          census_build_date 2023-10-23 #> 3           2     dataset_schema_version      3.1.0 #> 4           3           total_cell_count   68683222 #> 5           4          unique_cell_count   40356133 #> 6           5 number_donors_homo_sapiens      15588 #> 7           6 number_donors_mus_musculus       1990 census$close()"}]
diff --git a/r/sitemap.xml b/r/sitemap.xml
index 99261b647..93fc3fe4f 100644
--- a/r/sitemap.xml
+++ b/r/sitemap.xml
@@ -12,6 +12,9 @@
   <url>
     <loc>/articles/census_access_maintained_embeddings.html</loc>
   </url>
+  <url>
+    <loc>/articles/census_citation_generation.html</loc>
+  </url>
   <url>
     <loc>/articles/census_compute_over_X.html</loc>
   </url>
diff --git a/searchindex.js b/searchindex.js
index edfcab2ca..563e455ab 100644
--- a/searchindex.js
+++ b/searchindex.js
@@ -1 +1 @@
-Search.setIndex({"docnames": ["README", "_autosummary/cellxgene_census.download_source_h5ad", "_autosummary/cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe", "_autosummary/cellxgene_census.experimental.ml.pytorch.Stats", "_autosummary/cellxgene_census.experimental.ml.pytorch.experiment_dataloader", "_autosummary/cellxgene_census.experimental.pp.get_highly_variable_genes", "_autosummary/cellxgene_census.experimental.pp.highly_variable_genes", "_autosummary/cellxgene_census.experimental.pp.mean_variance", "_autosummary/cellxgene_census.experimental.util.X_sparse_iter", "_autosummary/cellxgene_census.get_anndata", "_autosummary/cellxgene_census.get_census_version_description", "_autosummary/cellxgene_census.get_census_version_directory", "_autosummary/cellxgene_census.get_default_soma_context", "_autosummary/cellxgene_census.get_presence_matrix", "_autosummary/cellxgene_census.get_source_h5ad_uri", "_autosummary/cellxgene_census.open_soma", "articles", "articles/2023/20230808-r_api_release", "articles/2023/20230919-out_of_core_methods", "articles/2023/20231012-normalized_layer_precalc_stats", "cellxgene_census_aws_open_data", "cellxgene_census_docsite_FAQ", "cellxgene_census_docsite_data_release_info", "cellxgene_census_docsite_installation", "cellxgene_census_docsite_landing", "cellxgene_census_docsite_quick_start", "cellxgene_census_docsite_schema", "cellxgene_census_mirroring", "cellxgene_census_schema", "cellxgene_census_storage_and_release_policy", "census_article_guidelines", "census_notebook_guidelines", "examples", "index", "notebooks/analysis_demo/comp_bio_census_info", "notebooks/analysis_demo/comp_bio_data_integration_scvi", "notebooks/analysis_demo/comp_bio_embedding_exploration", "notebooks/analysis_demo/comp_bio_explore_and_load_lung_data", "notebooks/analysis_demo/comp_bio_geneformer_prediction", "notebooks/analysis_demo/comp_bio_normalizing_full_gene_sequencing", "notebooks/analysis_demo/comp_bio_scvi_model_use", "notebooks/analysis_demo/comp_bio_summarize_axis_query", "notebooks/api_demo/census_access_maintained_embeddings", "notebooks/api_demo/census_compute_over_X", "notebooks/api_demo/census_dataset_presence", "notebooks/api_demo/census_datasets", "notebooks/api_demo/census_duplicated_cells", "notebooks/api_demo/census_embedding", "notebooks/api_demo/census_gget_demo", "notebooks/api_demo/census_query_extract", "notebooks/api_demo/census_summary_cell_counts", "notebooks/experimental/highly_variable_genes", "notebooks/experimental/mean_variance", "notebooks/experimental/pytorch", "python-api", "setup", "soma"], "filenames": ["README.md", "_autosummary/cellxgene_census.download_source_h5ad.rst", "_autosummary/cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe.rst", "_autosummary/cellxgene_census.experimental.ml.pytorch.Stats.rst", "_autosummary/cellxgene_census.experimental.ml.pytorch.experiment_dataloader.rst", "_autosummary/cellxgene_census.experimental.pp.get_highly_variable_genes.rst", "_autosummary/cellxgene_census.experimental.pp.highly_variable_genes.rst", "_autosummary/cellxgene_census.experimental.pp.mean_variance.rst", "_autosummary/cellxgene_census.experimental.util.X_sparse_iter.rst", "_autosummary/cellxgene_census.get_anndata.rst", "_autosummary/cellxgene_census.get_census_version_description.rst", "_autosummary/cellxgene_census.get_census_version_directory.rst", "_autosummary/cellxgene_census.get_default_soma_context.rst", "_autosummary/cellxgene_census.get_presence_matrix.rst", "_autosummary/cellxgene_census.get_source_h5ad_uri.rst", "_autosummary/cellxgene_census.open_soma.rst", "articles.rst", "articles/2023/20230808-r_api_release.md", "articles/2023/20230919-out_of_core_methods.md", "articles/2023/20231012-normalized_layer_precalc_stats.md", "cellxgene_census_aws_open_data.md", "cellxgene_census_docsite_FAQ.md", "cellxgene_census_docsite_data_release_info.md", "cellxgene_census_docsite_installation.md", "cellxgene_census_docsite_landing.md", "cellxgene_census_docsite_quick_start.md", "cellxgene_census_docsite_schema.md", "cellxgene_census_mirroring.md", "cellxgene_census_schema.md", "cellxgene_census_storage_and_release_policy.md", "census_article_guidelines.md", "census_notebook_guidelines.md", "examples.rst", "index.rst", "notebooks/analysis_demo/comp_bio_census_info.ipynb", "notebooks/analysis_demo/comp_bio_data_integration_scvi.ipynb", "notebooks/analysis_demo/comp_bio_embedding_exploration.ipynb", "notebooks/analysis_demo/comp_bio_explore_and_load_lung_data.ipynb", "notebooks/analysis_demo/comp_bio_geneformer_prediction.ipynb", "notebooks/analysis_demo/comp_bio_normalizing_full_gene_sequencing.ipynb", "notebooks/analysis_demo/comp_bio_scvi_model_use.ipynb", "notebooks/analysis_demo/comp_bio_summarize_axis_query.ipynb", "notebooks/api_demo/census_access_maintained_embeddings.ipynb", "notebooks/api_demo/census_compute_over_X.ipynb", "notebooks/api_demo/census_dataset_presence.ipynb", "notebooks/api_demo/census_datasets.ipynb", "notebooks/api_demo/census_duplicated_cells.ipynb", "notebooks/api_demo/census_embedding.ipynb", "notebooks/api_demo/census_gget_demo.ipynb", "notebooks/api_demo/census_query_extract.ipynb", "notebooks/api_demo/census_summary_cell_counts.ipynb", "notebooks/experimental/highly_variable_genes.ipynb", "notebooks/experimental/mean_variance.ipynb", "notebooks/experimental/pytorch.ipynb", "python-api.rst", "setup.rst", "soma.rst"], "titles": ["API Documentation", "cellxgene_census.download_source_h5ad", "cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe", "cellxgene_census.experimental.ml.pytorch.Stats", "cellxgene_census.experimental.ml.pytorch.experiment_dataloader", "cellxgene_census.experimental.pp.get_highly_variable_genes", "cellxgene_census.experimental.pp.highly_variable_genes", "cellxgene_census.experimental.pp.mean_variance", "cellxgene_census.experimental.util.X_sparse_iter", "cellxgene_census.get_anndata", "cellxgene_census.get_census_version_description", "cellxgene_census.get_census_version_directory", "cellxgene_census.get_default_soma_context", "cellxgene_census.get_presence_matrix", "cellxgene_census.get_source_h5ad_uri", "cellxgene_census.open_soma", "What\u2019s new?", "R package <code class=\"docutils literal notranslate\"><span class=\"pre\">cellxgene.census</span></code> V1 is out!", "Memory-efficient implementations of commonly used single-cell methods", "Introducing a normalized layer and pre-calculated cell and gene statistics in Census", "CZ CELLxGENE Discover Census in AWS", "FAQ", "Census data releases", "Installation", "CZ CELLxGENE Discover Census", "Quick start", "Census data and schema", "CELLxGENE Census Mirroring", "CZ CELLxGENE Discover Census Schema", "CZ CELLxGENE Discover Census storage &amp; release policy", "Census \u201cwhat\u2019s new?\u201d article editorial guidelines", "Census API notebook/vignette editorial guidelines", "Python tutorials", "CZ CELLxGENE Discover Census", "Learning about the CZ CELLxGENE Census", "Integrating multi-dataset slices of data", "Exploring biologically relevant clusters in Census embeddings", "Exploring all data from a tissue", "Geneformer for cell class prediction and data projection", "Normalizing full-length gene sequencing data", "scVI for cell type prediction and data projection", "Summarizing cell and gene metadata", "Access CELLxGENE collaboration embeddings (scVI, Geneformer)", "Computing on X using online (incremental) algorithms", "Genes measured in each cell (dataset presence matrix)", "Exploring the Census Datasets table", "Understanding and filtering out duplicate cells", "Access CELLxGENE-hosted embeddings", "Querying data using the gget cellxgene module", "Querying and fetching the single-cell data and cell/gene metadata.", "Exploring pre-calculated summary cell counts", "Experimental Highly Variable Genes API", "Out-of-core (incremental) mean and variance calculation", "Training a PyTorch Model", "Python API", "Installation", "What is SOMA"], "terms": {"The": [0, 1, 2, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 53, 54, 56], "websit": 0, "i": [0, 1, 2, 3, 5, 6, 7, 8, 9, 11, 12, 13, 14, 15, 16, 18, 19, 20, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55], "current": [0, 8, 11, 18, 19, 24, 25, 27, 33, 34, 35, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 56], "host": [0, 20, 22, 23, 24, 27, 28, 29, 31, 32, 33, 36, 38, 40, 42, 54, 55, 56], "http": [0, 4, 6, 8, 11, 21, 23, 27, 31, 35, 37, 38, 39, 40, 47, 48, 55], "chanzuckerberg": [0, 19, 23, 24, 28, 30, 31, 33, 48, 55], "github": [0, 8, 19, 21, 24, 28, 31, 33, 47, 48, 55], "io": [0, 6, 35, 37, 39], "cellxgen": [0, 10, 11, 14, 16, 19, 21, 22, 23, 25, 26, 30, 31, 32, 35, 36, 37, 38, 39, 40, 45, 46, 54, 55, 56], "censu": [0, 1, 5, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 23, 25, 35, 40, 42, 43, 48, 50, 51, 55, 56], "site": [0, 21, 30, 31, 35, 37, 39], "rebuilt": 0, "each": [0, 2, 8, 11, 18, 19, 21, 22, 25, 26, 27, 28, 32, 35, 36, 37, 38, 39, 41, 42, 43, 45, 47, 48, 50, 51, 53, 54], "time": [0, 11, 18, 21, 28, 46, 48, 53], "tag": [0, 20, 22, 29], "creat": [0, 6, 20, 21, 24, 25, 26, 29, 31, 33, 34, 35, 38, 42, 45, 47, 51], "repo": [0, 23, 54], "which": [0, 2, 4, 5, 6, 7, 8, 9, 11, 13, 15, 17, 18, 19, 26, 27, 28, 29, 30, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 49, 50, 51, 52, 53], "happen": [0, 11, 27], "releas": [0, 10, 11, 17, 19, 23, 25, 27, 28, 30, 34, 35, 37, 39, 41, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53], "includ": [0, 11, 18, 20, 21, 24, 30, 31, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 49, 50, 52, 54, 56], "regener": 0, "sphinx": 0, "python": [0, 2, 17, 18, 19, 22, 24, 30, 31, 33, 34, 38, 41, 44, 47, 48, 49, 56], "doc": [0, 4, 17, 21, 30, 31, 35, 53], "r": [0, 16, 19, 21, 22, 24, 30, 31, 33, 37, 38, 56], "pkgdown": 0, "check": [0, 17, 24, 25, 27, 33, 35, 39, 44, 47, 55], "git": [0, 55], "simpli": [0, 21, 38, 55], "copi": [0, 12, 20, 29, 35, 36, 37, 39, 40], "dure": [0, 35, 38], "rebuild": 0, "see": [0, 2, 4, 5, 6, 8, 18, 19, 20, 21, 23, 25, 26, 28, 35, 36, 37, 38, 39, 46, 47, 48, 49, 51, 53, 54], "vignettes_": 0, "further": [0, 12, 19, 30, 36, 41, 47], "explan": [0, 30, 31, 46], "A": [0, 2, 4, 6, 7, 8, 11, 12, 13, 14, 15, 20, 22, 24, 25, 26, 27, 28, 29, 30, 32, 33, 34, 35, 37, 38, 39, 40, 44, 45, 46, 47, 48, 49], "docsit": 0, "can": [0, 2, 4, 5, 6, 12, 15, 17, 18, 19, 20, 22, 24, 25, 26, 27, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 52, 53, 55], "trigger": 0, "manual": 0, "through": [0, 23, 24, 33, 40, 47, 49, 53], "workflow_dispatch": 0, "run": [0, 35, 36, 38, 40, 48, 53, 55], "workflow": [0, 32, 38, 47], "thi": [0, 1, 2, 3, 4, 5, 6, 8, 11, 14, 17, 18, 19, 20, 21, 22, 25, 26, 27, 28, 29, 30, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 55], "should": [0, 20, 22, 28, 29, 30, 31, 34, 35, 36, 37, 39, 41, 45, 53, 55], "done": [0, 5, 6, 7, 18, 20, 37, 39, 51, 53], "bug": [0, 24, 33], "found": [0, 13, 15, 17, 24, 33, 35, 36, 37, 39, 40, 45, 49], "necessari": [0, 18, 24, 31, 33, 36], "In": [0, 18, 19, 22, 23, 24, 28, 31, 33, 34, 35, 36, 37, 38, 42, 43, 44, 46, 47, 51, 53, 55], "order": [0, 2, 8, 22, 31, 38, 53], "test": [0, 38, 41, 53, 55], "chang": [0, 19, 28, 29], "local": [0, 2, 20, 36, 45, 53, 55], "first": [0, 2, 13, 17, 18, 23, 25, 35, 37, 38, 39, 41, 42, 43, 44, 46, 47, 53], "instal": [0, 30], "requir": [0, 2, 20, 28, 29, 37, 41, 42, 47, 48, 53], "pip": [0, 21, 23, 48, 55], "txt": 0, "brew": 0, "pandoc": 0, "mac": 0, "o": [0, 12, 38, 40, 48], "Then": [0, 35, 38, 39, 42, 47, 53], "And": [0, 19, 20, 25, 34, 35, 37, 38, 39, 42, 46, 47, 49], "follow": [0, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 29, 30, 31, 33, 34, 36, 37, 38, 40, 42, 46, 47, 49, 52, 53, 55], "command": [0, 21, 34, 38, 40], "cd": [0, 55], "make": [0, 17, 23, 28, 35, 37, 38, 39, 43, 55], "html": [0, 4, 6, 21, 35, 37, 39], "gener": [0, 3, 6, 18, 21, 22, 28, 34, 35, 36, 47, 48], "_build": 0, "index": [0, 2, 5, 7, 8, 9, 13, 26, 28, 36, 38, 40, 42, 43, 44, 45, 51, 52], "dataset_id": [1, 6, 14, 18, 28, 31, 34, 36, 37, 38, 39, 40, 42, 44, 45, 46, 47, 48, 49, 52], "str": [1, 2, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 28, 35, 36, 38, 48], "to_path": [1, 45], "census_vers": [1, 5, 10, 14, 15, 19, 22, 25, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53], "stabl": [1, 4, 5, 6, 11, 14, 15, 17, 22, 23, 25, 34, 35, 37, 39, 41, 43, 44, 45, 46, 48, 49, 50, 51, 52, 53], "none": [1, 2, 3, 5, 6, 9, 10, 11, 12, 15, 28, 36, 37, 38, 43, 48], "download": [1, 18, 21, 42, 47, 54], "sourc": [1, 14, 15, 20, 23, 28, 29, 47, 48, 53, 55], "h5ad": [1, 10, 11, 14, 15, 20, 28, 29, 35, 38, 39, 44, 48, 54], "dataset": [1, 5, 6, 13, 17, 19, 20, 22, 24, 26, 30, 31, 32, 33, 34, 36, 39, 40, 41, 42, 43, 46, 47, 48, 49, 50], "given": [1, 2, 8, 10, 18, 20, 22, 28, 29, 36, 37, 43, 44, 45, 47, 53], "user": [1, 6, 12, 14, 17, 18, 19, 20, 21, 24, 26, 27, 30, 31, 33, 35, 37, 38, 39, 40, 43, 51, 53], "specifi": [1, 2, 5, 6, 7, 11, 12, 15, 19, 20, 22, 25, 27, 29, 34, 35, 37, 39, 41, 43, 44, 45, 46, 48, 49, 50, 51, 52, 53], "file": [1, 15, 20, 21, 22, 27, 28, 29, 34, 38, 40, 41, 48], "name": [1, 2, 5, 6, 8, 10, 11, 14, 20, 22, 25, 26, 28, 29, 30, 34, 35, 36, 37, 39, 41, 43, 46, 47, 48, 49, 51, 54], "paramet": [1, 2, 4, 5, 6, 7, 8, 9, 10, 12, 13, 14, 15, 35, 37, 39], "fetch": [1, 2, 5, 6, 9, 17, 30, 31, 32, 38, 40, 42, 46, 53], "origin": [1, 2, 8, 19, 28, 36, 37, 38, 40, 46, 53], "associ": [1, 8, 28, 32, 37, 38], "where": [1, 2, 7, 8, 27, 28, 29, 31, 35, 36, 37, 39, 41, 42, 43, 46, 47, 51, 52, 53], "written": [1, 5, 9, 30], "must": [1, 2, 5, 6, 23, 25, 28, 29, 30, 31, 36, 46, 55], "alreadi": [1, 36, 40], "exist": [1, 14, 20, 21, 24, 27, 29, 33, 34, 37, 38, 46], "version": [1, 8, 10, 11, 14, 15, 17, 19, 21, 23, 27, 31, 34, 35, 36, 38, 40, 41, 42, 44, 46, 47, 48, 49], "default": [1, 2, 5, 7, 8, 9, 11, 12, 14, 15, 22, 27, 35, 39, 43, 48, 52, 53], "rais": [1, 4, 5, 6, 10, 13, 14, 15, 34, 41], "valueerror": [1, 4, 5, 6, 10, 13, 15], "path": [1, 15, 20, 28, 29, 38, 48], "e": [1, 2, 6, 7, 8, 15, 19, 20, 22, 24, 26, 27, 28, 29, 30, 33, 34, 36, 37, 41, 42, 43, 44, 45, 46, 47, 48, 51, 55], "overwrit": 1, "an": [1, 2, 4, 5, 7, 8, 9, 11, 15, 17, 18, 19, 20, 23, 24, 25, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 41, 43, 45, 49, 52, 54, 55], "lifecycl": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15], "matur": [1, 9, 10, 11, 13, 14, 15, 34, 36], "get_source_h5ad_uri": [1, 15, 45], "look": [1, 15, 19, 27, 34, 35, 37, 38, 39, 40, 42, 46, 47, 48, 49, 53, 56], "up": [1, 15, 18, 40, 43, 46], "locat": [1, 12, 15, 21, 27, 29, 45, 47, 49], "exampl": [1, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 17, 19, 20, 21, 23, 25, 28, 29, 32, 35, 36, 37, 42, 43, 47, 48, 49, 53, 55], "8e47ed12": 1, "c658": 1, "4252": [1, 37, 44], "b126": 1, "381df8d52a3d": 1, "tmp": [1, 15], "data": [1, 2, 3, 4, 5, 6, 8, 10, 11, 14, 18, 23, 25, 27, 30, 31, 36, 41, 42, 43, 44, 50, 51, 52, 53, 56], "class": [2, 3, 13, 25, 26, 32, 42, 43, 44, 47], "experi": [2, 5, 8, 9, 12, 19, 26, 31, 36, 41, 42, 44, 45, 47, 50, 51, 53], "measurement_nam": [2, 5, 8, 9, 13, 18, 19, 25, 36, 38, 40, 42, 43, 44, 46, 47, 51, 52, 53], "raw": [2, 5, 6, 7, 8, 9, 18, 19, 25, 26, 34, 36, 37, 42, 43, 46, 47, 52, 53], "x_name": [2, 5, 8, 9, 19, 42, 47, 53], "x": [2, 5, 6, 7, 8, 9, 19, 25, 26, 30, 31, 34, 35, 36, 37, 38, 39, 40, 42, 46, 47, 52, 53], "obs_queri": [2, 18, 19, 25, 42, 43, 46, 47, 51, 52, 53], "axisqueri": [2, 18, 19, 25, 42, 43, 46, 47, 51, 52, 53], "var_queri": [2, 18, 43, 53], "obs_column_nam": [2, 17, 19, 25, 53], "sequenc": [2, 5, 6, 9, 24, 26, 31, 32, 33, 35, 36, 37, 44, 45, 47], "batch_siz": [2, 4, 53], "int": [2, 3, 4, 5, 6, 7, 8, 9, 28, 36, 40, 43], "1": [2, 7, 8, 12, 18, 19, 20, 22, 25, 26, 27, 29, 30, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 55], "shuffl": [2, 4, 53], "bool": [2, 7, 8, 11, 36], "fals": [2, 7, 8, 11, 12, 18, 20, 28, 29, 34, 35, 36, 37, 38, 40, 46, 48, 49, 50, 51, 52], "seed": [2, 35, 53], "return_sparse_x": 2, "soma_chunk_s": [2, 53], "use_eager_fetch": [2, 8], "true": [2, 5, 7, 8, 11, 18, 23, 28, 29, 31, 34, 35, 36, 37, 39, 40, 41, 43, 46, 47, 48, 49, 50, 51, 52, 53], "iter": [2, 8, 17, 19, 20, 25, 30, 42, 43, 46, 53, 56], "style": [2, 53], "datapip": [2, 4, 53], "read": [2, 3, 8, 9, 13, 18, 19, 20, 21, 24, 25, 26, 28, 33, 34, 35, 36, 37, 38, 39, 41, 43, 44, 45, 47, 49, 50, 51, 53], "ob": [2, 5, 6, 7, 8, 9, 17, 20, 25, 26, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 47, 50, 51, 52, 53], "from": [2, 7, 10, 13, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 34, 39, 40, 42, 43, 44, 46, 47, 49, 50, 51, 52, 53, 55], "soma": [2, 3, 5, 6, 7, 8, 9, 10, 11, 12, 15, 17, 18, 21, 22, 24, 25, 27, 28, 29, 31, 33, 34, 36, 40, 41, 42, 43, 44, 45, 47, 51, 52, 53, 54], "base": [2, 5, 11, 17, 18, 19, 24, 26, 29, 33, 34, 36, 37, 38, 40, 42, 46, 47, 48, 49, 51, 56], "upon": [2, 5, 15, 22, 34, 41, 51], "queri": [2, 5, 6, 7, 8, 9, 13, 18, 22, 24, 28, 31, 32, 33, 34, 35, 37, 40, 41, 43, 45, 46, 50, 51, 52, 53], "along": [2, 7, 17, 19, 29, 38, 52, 53], "var": [2, 5, 6, 7, 8, 9, 13, 18, 25, 26, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 47, 48, 51, 52, 53], "ax": [2, 7, 53], "provid": [2, 15, 20, 21, 22, 24, 25, 26, 27, 28, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 50, 51, 53, 54], "over": [2, 6, 7, 8, 15, 19, 25, 43, 47, 48, 52], "when": [2, 4, 5, 6, 27, 28, 29, 36, 43, 47, 48, 50, 51, 53], "object": [2, 5, 9, 12, 13, 14, 15, 17, 19, 21, 24, 28, 30, 33, 34, 35, 36, 37, 41, 42, 45, 47, 49, 53, 56], "pass": [2, 4, 12, 35, 40, 43, 48, 49, 53], "": [2, 6, 11, 17, 20, 21, 28, 31, 32, 34, 35, 36, 37, 38, 39, 40, 42, 43, 44, 46, 47, 49, 52, 53], "built": [2, 19, 24, 28, 33, 54, 56], "function": [2, 5, 6, 19, 21, 22, 34, 43, 47, 48, 50, 51, 53, 54], "batch": [2, 5, 6, 18, 31, 36, 38, 40, 43, 51, 53], "x_batch": [2, 53], "y_batch": [2, 53], "control": [2, 8, 18, 51, 53], "number": [2, 4, 5, 6, 7, 8, 11, 19, 22, 28, 37, 38, 39, 40, 42, 43, 45, 46, 47, 51, 52, 53, 54], "row": [2, 6, 7, 8, 13, 19, 25, 28, 34, 36, 37, 42, 43, 44, 45, 47, 48, 49, 50, 51, 52, 53], "ar": [2, 4, 6, 7, 8, 11, 15, 17, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 47, 48, 49, 51, 52, 53, 55], "return": [2, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 34, 36, 41, 42, 43, 44, 48, 49, 50, 51, 52, 53], "If": [2, 4, 5, 6, 7, 8, 11, 12, 15, 20, 21, 22, 23, 24, 27, 28, 29, 31, 33, 34, 37, 41, 46, 47, 48, 53, 55], "tensor": [2, 53], "have": [2, 11, 17, 19, 22, 23, 24, 28, 30, 33, 34, 35, 36, 39, 40, 41, 42, 43, 44, 47, 51, 53], "rank": [2, 5, 6, 51, 53], "0": [2, 3, 4, 5, 6, 7, 8, 9, 18, 19, 22, 25, 26, 27, 30, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 47, 48, 49, 50, 51, 52, 53], "2415": 2, "dtype": [2, 5, 8, 9, 34, 35, 36, 37, 39, 41, 42, 43, 46, 47, 49, 53], "torch": [2, 4, 53], "int64": [2, 8, 28, 34, 35, 37, 39, 41, 43, 46, 49], "encod": [2, 34, 35, 41, 42, 43, 47, 53], "For": [2, 5, 6, 7, 8, 17, 19, 20, 21, 23, 24, 25, 27, 28, 29, 30, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 46, 48, 49, 51, 53, 54, 55], "larger": [2, 21, 24, 25, 33, 36, 43, 56], "valu": [2, 5, 6, 7, 8, 9, 10, 13, 17, 18, 19, 21, 22, 26, 28, 29, 34, 35, 36, 37, 39, 40, 41, 42, 43, 46, 47, 48, 49, 51, 52, 53, 56], "2": [2, 10, 11, 12, 14, 15, 18, 20, 21, 22, 23, 25, 27, 29, 30, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 55], "dataload": [2, 4], "3": [2, 5, 6, 18, 21, 22, 23, 25, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 55], "2416": 2, "4": [2, 18, 22, 25, 28, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 53], "2417": 2, "whether": [2, 48], "dens": [2, 8, 21, 24, 26, 33], "spars": [2, 7, 8, 13, 21, 24, 25, 26, 31, 33, 35, 36, 37, 39, 42, 43, 44, 47], "model": [2, 5, 6, 22, 24, 28, 33, 35, 36, 42, 47, 51, 56], "support": [2, 4, 8, 20, 23, 24, 26, 27, 28, 29, 33, 36, 38, 48, 52, 53, 56], "us": [2, 3, 4, 5, 6, 7, 8, 11, 12, 15, 16, 20, 22, 23, 25, 26, 27, 28, 29, 30, 31, 34, 35, 36, 37, 39, 41, 42, 44, 45, 46, 47, 49, 50, 51, 52, 53, 54, 55, 56], "reduc": [2, 12, 19, 37, 42, 46, 47, 53], "memori": [2, 8, 12, 16, 17, 19, 21, 23, 24, 30, 32, 33, 41, 43, 45, 46, 48, 49, 53, 55, 56], "usag": [2, 8, 18, 20, 21, 25, 30, 35, 46, 53], "determin": [2, 28, 44, 53], "column": [2, 5, 6, 7, 8, 9, 25, 26, 28, 34, 36, 37, 38, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53], "element": [2, 7, 13, 42, 43, 44, 52], "alwai": [2, 8, 11, 26, 46], "soma_joinid": [2, 5, 7, 8, 9, 13, 18, 22, 25, 28, 34, 35, 36, 37, 39, 42, 43, 44, 45, 47, 48, 49, 50, 51, 52], "datafram": [2, 5, 6, 7, 9, 13, 17, 19, 25, 26, 28, 34, 36, 37, 41, 42, 43, 44, 45, 47, 48, 49, 51, 52, 53], "equiaval": 2, "soma_dim_0": [2, 8, 42, 43, 46, 47], "matrix": [2, 7, 8, 13, 19, 21, 24, 25, 26, 32, 33, 34, 35, 36, 37, 39, 42, 47, 48], "remain": [2, 36], "string": [2, 6, 27, 28, 29, 47, 49, 53], "type": [2, 8, 13, 17, 20, 22, 25, 26, 29, 32, 35, 36, 38, 39, 42, 43, 44, 50, 53, 55], "integ": [2, 5, 9, 26, 29, 37, 39, 43, 53], "need": [2, 8, 23, 25, 31, 34, 35, 38, 40, 44, 46, 49, 55], "decod": [2, 47, 53], "obtain": [2, 18, 31, 34, 35, 37, 38, 40, 46, 49, 53], "call": [2, 6, 20, 22, 25, 27, 34, 35, 37, 39, 41, 43, 44, 45, 46, 48, 49, 50, 51, 52, 53], "its": [2, 12, 17, 19, 20, 22, 24, 26, 28, 33, 35, 38, 40, 41, 44, 46, 49, 53, 56], "inverse_transform": [2, 53], "method": [2, 3, 4, 5, 6, 12, 16, 19, 20, 21, 22, 34, 36, 39, 41, 42, 43, 45, 47, 49, 51, 53, 56], "exp_data_pip": 2, "obs_encod": [2, 53], "obs_attr_nam": 2, "encoded_valu": 2, "__init__": [2, 3, 43, 53], "construct": [2, 34, 36, 37, 44, 45, 47], "new": [2, 22, 24, 25, 28, 33, 35, 38, 48, 53], "measur": [2, 5, 9, 13, 18, 19, 26, 28, 32, 37, 39, 45, 47], "layer": [2, 5, 6, 7, 8, 9, 16, 24, 28, 30, 33, 35, 42, 44, 48, 52], "filter": [2, 5, 9, 11, 17, 18, 19, 21, 22, 24, 25, 26, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 47, 48, 49, 50, 53], "axi": [2, 5, 7, 8, 9, 18, 26, 36, 37, 38, 39, 40, 41, 42, 43, 46, 47, 51, 52, 53], "all": [2, 5, 6, 9, 11, 17, 19, 20, 21, 22, 24, 25, 26, 28, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 42, 43, 45, 46, 47, 48, 49, 50, 55, 56], "veri": [2, 50], "larg": [2, 8, 17, 34, 37, 43, 46, 47, 48, 49, 50], "gene": [2, 5, 6, 16, 17, 21, 24, 25, 26, 28, 30, 31, 32, 33, 36, 38, 40, 42, 46, 47, 53], "featur": [2, 13, 24, 25, 26, 30, 32, 33, 37, 38, 40, 42, 44, 47, 48, 51], "doe": [2, 14, 27, 40, 43, 47, 53], "onli": [2, 6, 7, 8, 11, 15, 18, 19, 22, 25, 26, 27, 28, 29, 34, 35, 36, 37, 38, 39, 41, 42, 43, 46, 47, 49, 51, 53], "result": [2, 5, 6, 7, 8, 11, 18, 25, 35, 36, 40, 41, 42, 43, 47, 49, 51, 52, 53], "being": [2, 53], "singl": [2, 5, 6, 8, 16, 20, 24, 27, 28, 30, 31, 32, 33, 34, 35, 36, 39, 44, 46, 47, 48, 53, 54, 56], "multipl": [2, 6, 8, 11, 24, 26, 28, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 47, 49, 50], "perform": [2, 11, 18, 19, 22, 23, 24, 25, 33, 34, 35, 37, 39, 43, 46, 47, 49, 52, 53], "reason": [2, 11, 28, 29, 36], "two": [2, 19, 20, 26, 28, 31, 34, 35, 42, 47, 48, 49, 51], "step": [2, 8, 18, 21, 37, 38, 53], "global": [2, 36, 37, 53], "contigu": 2, "group": [2, 28, 34, 36, 38, 50], "chunk": [2, 7, 8, 21, 42, 46, 53], "random": [2, 35, 36, 37, 38, 40, 53], "within": [2, 25, 28, 30, 31, 34, 36, 47, 53], "sinc": [2, 4, 17, 21, 22, 30, 35, 37, 46, 48, 53], "retriev": [2, 3, 15, 17, 19, 27, 28, 32, 34, 42, 53], "keep": [2, 19, 38, 50, 55], "fix": [2, 21, 28, 53], "size": [2, 7, 8, 26, 28, 36, 38, 40, 42, 47, 50, 53], "ensur": [2, 19, 21, 25, 31, 34, 35, 37, 39, 41, 43, 44, 45, 46, 48, 49, 50, 51, 52, 53], "ani": [2, 4, 5, 6, 8, 9, 12, 15, 17, 18, 19, 20, 21, 22, 24, 25, 28, 31, 33, 34, 36, 40, 42, 43, 44, 45, 47, 50, 51, 53], "posit": [2, 8, 34, 37, 38, 43], "non": [2, 11, 18, 21, 26, 28, 31, 34, 36, 37, 38, 43, 46, 47, 49], "occur": [2, 5, 6, 21, 47], "would": [2, 35, 42, 46, 53], "second": [2, 13, 17, 30, 31, 42, 44, 47, 53, 55], "so": [2, 21, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 53], "note": [2, 8, 17, 24, 26, 27, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 47, 48, 49, 50, 53], "maintain": [2, 35, 42, 47], "proxim": [2, 37, 50], "even": [2, 47], "after": [2, 21, 30, 31, 37], "some": [2, 4, 8, 18, 28, 34, 35, 36, 37, 38, 39, 40, 46, 48, 55], "mai": [2, 5, 9, 11, 17, 21, 22, 23, 24, 28, 29, 30, 31, 33, 34, 35, 36, 43, 44, 45, 46, 47, 53], "suffici": [2, 21, 53, 55], "train": [2, 32, 35, 47], "process": [2, 4, 8, 18, 19, 21, 34, 38, 43, 46], "To": [2, 12, 17, 19, 21, 22, 23, 24, 28, 31, 33, 34, 35, 36, 37, 38, 39, 40, 45, 46, 47, 48, 49, 53, 56], "end": [2, 28, 35, 36, 46], "treat": 2, "hyperparamet": 2, "tune": [2, 22, 42], "distributeddataparallel": 2, "partit": 2, "disjoint": [2, 26], "across": [2, 17, 21, 24, 25, 26, 28, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 49, 50], "worker": [2, 4], "As": [2, 18, 24, 25, 26, 28, 33, 35, 39, 42, 44, 47, 49, 52, 56], "set": [2, 8, 12, 15, 18, 19, 25, 29, 35, 36, 38, 40, 44, 51, 53], "still": [2, 35], "impact": [2, 36], "aspect": 2, "behavior": 2, "maximum": [2, 5, 6, 53], "util": [2, 4, 18, 21, 31, 36, 38, 40, 41, 43, 46, 47, 55], "better": [2, 28, 32], "also": [2, 8, 11, 18, 20, 21, 23, 36, 38, 40, 41, 44, 45, 46, 48, 49, 51, 53, 55], "more": [2, 5, 6, 17, 18, 19, 20, 21, 22, 23, 25, 28, 29, 34, 35, 36, 38, 39, 40, 41, 42, 43, 46, 47, 48, 49, 51, 53, 54], "granular": [2, 53], "detail": [2, 18, 20, 24, 25, 33, 35, 36, 47, 49, 53], "gib": 2, "ram": [2, 43, 48, 55], "per": [2, 6, 18, 19, 21, 28, 34, 37, 39, 44, 53], "cell": [2, 5, 6, 8, 10, 11, 14, 16, 20, 21, 24, 27, 29, 30, 31, 32, 33, 35, 39, 45, 51, 52, 53, 56], "request": [2, 20, 21, 24, 33, 38, 41, 43, 50, 51, 53], "assum": [2, 6, 36, 43, 53], "sparsiti": 2, "95": 2, "depend": [2, 17, 21, 23, 35, 38, 40], "next": [2, 17, 19, 20, 25, 53], "immedi": [2, 30, 31], "previous": [2, 36, 37], "made": [2, 36], "avail": [2, 6, 11, 18, 19, 21, 22, 23, 27, 29, 35, 37, 38, 42, 47, 48, 49, 51, 54], "via": [2, 3, 20, 21, 22, 23, 24, 25, 27, 33, 34, 35, 37, 38, 39, 40, 41, 45, 49, 53, 55, 56], "allow": [2, 17, 19, 40, 41, 46, 53], "network": 2, "filesystem": 2, "parallel": [2, 8, 43], "client": [2, 21], "side": 2, "potenti": [2, 36], "improv": [2, 8], "overal": [2, 53], "cost": [2, 8, 21], "doubl": [2, 28], "attribut": [2, 3, 38, 42, 47, 48, 53], "n_ob": [3, 25, 37, 38, 40, 42, 43, 45, 47, 48, 49], "nnz": [3, 7, 19, 28, 42, 47], "elaps": 3, "n_soma_chunk": 3, "statist": [3, 7, 16, 43, 50], "about": [3, 17, 19, 21, 24, 25, 28, 29, 31, 32, 33, 35, 39, 41, 42, 46, 47, 48, 49], "experimentdatapip": [3, 4], "api": [3, 6, 8, 18, 19, 22, 23, 24, 25, 27, 28, 30, 32, 33, 34, 35, 37, 39, 41, 44, 45, 48, 49, 53, 55, 56], "assess": [3, 36, 37], "throughput": 3, "attr": 3, "iterdatapip": [4, 53], "num_work": 4, "dataloader_kwarg": 4, "factori": 4, "safe": 4, "instanti": [4, 53], "work": [4, 17, 19, 23, 24, 33, 34, 55], "constructor": [4, 53], "param": [4, 11, 15], "applic": [4, 8, 47], "sampler": [4, 53], "batch_sampl": [4, 53], "collate_fn": [4, 53], "other": [4, 8, 18, 19, 28, 30, 34, 36, 39, 42, 43, 44, 45, 46, 47, 49, 55], "ha": [4, 5, 6, 17, 19, 24, 26, 28, 30, 31, 33, 34, 35, 38, 39, 42, 44, 46, 47, 55, 56], "been": [4, 17, 19, 22, 30, 47, 55], "chain": [4, 53], "load": [4, 17, 21, 24, 31, 33, 35, 37, 40, 49, 53, 55], "main": [4, 21, 23, 26, 31, 36, 42, 46, 47], "addit": [4, 8, 9, 23, 24, 28, 31, 33, 34, 38, 40, 45, 48, 51, 52], "keyword": [4, 30], "argument": [4, 6, 15, 18, 19, 48, 49, 51, 52], "except": [4, 34, 36, 39, 49], "org": [4, 23], "collect": [5, 9, 13, 15, 20, 22, 26, 29, 34, 37, 38, 39, 40, 44, 48], "organ": [5, 9, 13, 17, 18, 19, 21, 24, 25, 26, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 49, 50, 51, 53], "rna": [5, 8, 9, 13, 18, 19, 21, 24, 25, 26, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 49, 50, 51, 52, 53], "obs_value_filt": [5, 9, 17, 18, 19, 22, 25, 35, 36, 38, 39, 40, 42, 45, 46, 47, 49, 51, 52], "obs_coord": [5, 8, 9, 36, 37], "byte": [5, 9], "slice": [5, 9, 18, 19, 21, 24, 30, 31, 32, 33, 34, 37, 42, 43, 44, 45, 47, 49, 56], "float": [5, 6, 9, 19, 46, 53], "datetime64": [5, 9], "timestamptyp": [5, 9], "arrai": [5, 8, 9, 13, 21, 24, 26, 33, 37, 39, 43, 44, 53], "chunkedarrai": [5, 9], "ndarrai": [5, 8, 9, 43, 47], "var_value_filt": [5, 9, 17, 19, 25, 46, 49], "var_coord": [5, 8, 9, 37], "n_top_gen": [5, 6, 18, 35, 37, 39, 51], "1000": [5, 6, 8, 9, 18, 28, 35, 39], "flavor": [5, 6, 35, 37], "liter": [5, 6, 8], "seurat_v3": [5, 6, 35, 37, 51], "span": [5, 6, 21, 36, 51], "batch_kei": [5, 6, 18, 35, 51], "max_loess_jitt": [5, 6], "1e": [5, 6, 53], "06": [5, 6, 29], "batch_key_func": [5, 6], "callabl": [5, 6], "conveni": [5, 20, 34, 41, 43, 44, 45, 49, 51, 56], "wrapper": [5, 9, 20, 34, 51], "convienc": [5, 9], "around": [5, 9, 25, 51], "highly_variable_gen": [5, 18, 35, 37, 38, 39], "build": [5, 9, 20, 21, 22, 23, 26, 28, 29, 34, 37, 42, 47, 48], "execut": [5, 9, 20, 46], "annot": [5, 6, 21, 26, 28, 34, 35, 37, 38, 40, 51], "variabl": [5, 6, 19, 21, 24, 25, 26, 28, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 49, 50, 53], "inform": [5, 6, 19, 20, 21, 24, 26, 27, 30, 31, 33, 34, 35, 36, 37, 38, 40, 45, 46, 47, 48, 49, 51, 54], "usual": [5, 9, 13, 18, 21, 53], "open_soma": [5, 8, 9, 12, 17, 18, 19, 20, 22, 25, 27, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 55], "one": [5, 8, 9, 13, 15, 21, 22, 26, 27, 28, 29, 30, 31, 34, 35, 36, 38, 40, 45, 46, 47, 48, 49, 53], "homo": [5, 9, 13, 17, 18, 19, 22, 25, 26, 28, 34, 37, 38, 40, 44, 46, 49, 50], "sapien": [5, 9, 13, 17, 18, 19, 22, 25, 26, 28, 34, 37, 38, 40, 44, 46, 49, 50], "mu": [5, 9, 13, 22, 28, 34, 35, 39, 45, 50], "musculu": [5, 9, 13, 22, 28, 34, 35, 39, 45, 50], "metadata": [5, 9, 18, 20, 21, 24, 26, 31, 32, 33, 35, 36, 38, 39, 40, 42, 43, 44, 45, 46, 50, 51, 53, 55], "value_filt": [5, 9, 17, 18, 19, 20, 22, 25, 34, 35, 36, 37, 39, 42, 43, 46, 47, 49, 50, 51, 52, 53], "syntax": [5, 9], "coordin": [5, 8, 9, 36, 43], "list": [5, 6, 9, 20, 24, 26, 27, 28, 30, 31, 33, 34, 36, 37, 38, 40, 41, 44, 48, 49, 54], "select": [5, 6, 7, 9, 19, 25, 27, 31, 35, 36, 37, 38, 42, 44, 45, 46, 47, 49, 51], "fraction": [5, 6, 18, 51], "estim": [5, 6, 51], "loess": [5, 6, 51], "varianc": [5, 6, 7, 19, 28, 32, 51], "fit": [5, 6, 35, 40, 41, 43, 51], "combin": [5, 6, 17, 21, 28, 34, 35, 36, 37, 40, 41, 43, 44, 46, 49], "identifi": [5, 6, 11, 18, 22, 27, 29, 36, 39], "max_lowess_jitt": [5, 6, 51], "jitter": [5, 6, 37, 51], "add": [5, 6, 9, 19, 23, 28, 38, 39, 43, 47], "case": [5, 6, 26, 28, 34, 35, 36, 39, 42, 43, 46, 47, 51, 52, 53], "failur": [5, 6], "low": [5, 6, 21, 24, 33], "entri": [5, 6, 27], "count": [5, 6, 18, 19, 21, 24, 25, 26, 32, 33, 35, 37, 38, 39, 41, 45, 46, 49], "panda": [5, 6, 7, 21, 24, 25, 33, 34, 36, 37, 40, 41, 43, 44, 45, 49, 50, 51, 52, 53], "contain": [5, 6, 9, 10, 11, 13, 14, 15, 26, 27, 28, 29, 30, 31, 34, 35, 36, 37, 38, 39, 41, 43, 44, 45, 46, 47, 48, 49, 50, 52, 53, 54], "paramat": [5, 6, 35], "subset": [5, 35, 36, 37, 38, 39, 40, 47, 52, 53], "match": [5, 38, 40, 41, 45, 47, 48, 49, 51], "hvg": [5, 6, 18, 51], "is_primary_data": [5, 18, 24, 26, 28, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53], "tissue_gener": [5, 9, 17, 18, 20, 25, 28, 34, 36, 37, 42, 45, 46, 47, 48, 49, 50, 51, 52, 53], "lung": [5, 9, 21, 28, 31, 34, 35, 38, 41, 44, 45, 46, 48, 49], "500": [5, 19, 21, 37, 39, 51], "anndata": [5, 9, 19, 20, 21, 24, 28, 33, 35, 36, 37, 38, 39, 40, 43, 45, 49, 56], "top": [5, 15, 18, 28, 29, 37, 41, 45, 50, 51], "mus_musculu": [5, 28, 39, 41, 43, 45, 46, 47, 48, 49, 51, 52], "get": [5, 10, 11, 15, 17, 18, 19, 24, 25, 31, 33, 34, 35, 36, 37, 38, 39, 40, 42, 44, 45, 46, 47, 49, 56], "highli": [5, 6, 21, 32, 35, 36, 37, 38, 39, 40, 53, 55, 56], "just": [5, 18, 21, 34, 37, 43, 46, 48], "hvg_soma_id": 5, "highly_vari": [5, 18, 37, 38, 39, 51], "adata": [5, 19, 25, 28, 35, 36, 37, 38, 40, 42, 45, 46, 47, 48, 49], "get_anndata": [5, 19, 25, 35, 36, 37, 38, 39, 40, 45, 46, 49, 51], "experimentaxisqueri": [6, 7, 8, 51, 52], "scanpi": [6, 18, 21, 25, 31, 35, 36, 37, 38, 39, 40, 42, 45, 47, 48, 51, 54], "mimic": 6, "seurat": [6, 18, 19, 21, 23, 24, 30, 33, 56], "v3": [6, 18, 23, 25, 28, 34, 37, 49], "readthedoc": [6, 35, 37, 39], "en": [6, 35, 37, 39], "g": [6, 7, 15, 20, 22, 24, 26, 27, 28, 29, 30, 33, 34, 36, 41, 43, 45, 47, 48, 51, 55], "kei": [6, 28, 29, 34, 35, 36, 37, 42, 43, 47, 49], "convert": [6, 17, 25, 42, 43], "concaten": [6, 25, 35, 42, 46, 47, 52], "them": [6, 17, 20, 21, 35, 38, 42, 46, 47, 49], "option": [6, 11, 14, 15, 20, 23, 28, 29, 45, 48, 55], "defin": [6, 8, 21, 26, 27, 28, 29, 31, 34, 41, 43, 48, 49], "onc": [6, 11, 17, 22, 34, 41, 43, 53], "receiv": [6, 37], "seri": [6, 28, 37, 43], "ident": [6, 34], "those": [6, 18, 35, 37, 39, 43], "produc": 6, "donor_id": [6, 28, 31, 34, 37, 42, 45, 47, 48, 49, 52], "lambda": [6, 40], "batch0": 6, "99": 6, "els": [6, 36, 44, 53], "batch1": 6, "calculate_mean": [7, 18, 52], "calculate_vari": [7, 18, 52], "ddof": [7, 52], "nnz_onli": 7, "calcul": [7, 16, 28, 32, 35, 36, 38], "mean": [7, 18, 28, 31, 32, 51, 55], "accumul": [7, 18, 43], "fashion": [7, 17, 18, 30], "total": [7, 18, 21, 22, 26, 28, 34, 37, 39], "n": [7, 19, 21, 25, 26, 28, 34, 37, 39, 42, 43, 47, 52], "correspond": [7, 11, 19, 20, 28, 31, 34, 36, 37, 38, 39, 40, 41, 42, 43, 46, 47, 49], "dimens": [7, 13, 26, 42, 44, 47, 53], "wise": [7, 37], "metric": [7, 31, 36, 40], "explicitli": [7, 19, 28, 47], "store": [7, 8, 13, 19, 26, 28, 29, 31, 34, 36, 38, 41, 42, 44, 47, 48], "comput": [7, 17, 18, 21, 24, 33, 34, 52, 53], "otherwis": [7, 28, 29, 46], "skip": [7, 8], "delta": [7, 43, 52], "degre": [7, 36, 52], "freedom": [7, 52], "divisor": [7, 52], "repres": [7, 17, 22, 26, 28, 37, 47, 52], "stride": 8, "65536": 8, "fmt": 8, "csr": [8, 13, 42], "csc": 8, "reindex_sparse_axi": 8, "tupl": [8, 42, 43], "spmatrix": 8, "deprec": [8, 27, 35], "8": [8, 18, 23, 25, 34, 35, 36, 37, 38, 39, 40, 42, 44, 46, 47, 48, 49, 51, 52, 53, 55], "remov": [8, 28, 35, 37, 46], "9": [8, 22, 25, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 46, 47, 48, 49, 53], "pleas": [8, 17, 19, 20, 21, 24, 30, 33, 35, 36, 37, 38, 39, 40, 46, 48, 56], "blockwis": [8, 42, 47], "introduc": [8, 16, 36, 48], "tiledbsoma": [8, 12, 18, 19, 20, 25, 36, 38, 40, 42, 43, 46, 47, 51, 52, 53, 54], "5": [8, 22, 23, 25, 28, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 51, 52, 53], "pagin": 8, "peak": 8, "yield": [8, 36], "content": [8, 20, 22, 25, 26, 27, 28, 29, 30, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 49, 50, 52, 53], "scipi": [8, 13, 21, 24, 31, 33, 35, 36, 37, 39, 44, 47], "csr_matrix": [8, 13, 31, 35, 39], "csc_matrix": 8, "position": [8, 43, 44], "j": [8, 28, 36, 44, 45], "aka": [8, 43], "soma_dim_1": [8, 42, 43, 46, 47], "present": [8, 21, 24, 26, 28, 29, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 47, 49, 50], "zero": [8, 18, 19, 26, 28, 36, 43, 47, 51], "layout": [8, 53], "thread": 8, "speed": [8, 18, 21], "instead": [8, 35, 36, 39, 48, 53], "reindex": 8, "respect": [8, 17, 19, 23, 28, 34, 36, 42, 48, 49], "streamlin": 8, "oper": [8, 12, 21, 25, 34, 41, 43, 49, 53], "slightli": 8, "prefer": [8, 34, 41, 45], "address": 8, "directli": [8, 17, 20, 21, 22, 32, 34, 36, 37, 41, 42, 45, 49, 53, 54], "wai": [8, 18, 34, 41, 42, 44, 46, 47, 49], "regardless": 8, "underli": [8, 36, 53, 54], "indptr": 8, "exp": [8, 38, 40], "census_data": [8, 17, 18, 19, 20, 25, 34, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 49, 50, 51, 52, 53], "axis_queri": [8, 18, 19, 25, 42, 43, 46, 47, 51, 52], "obs_soma_joinid": [8, 47], "var_soma_joinid": 8, "x_chunk": 8, "com": [8, 11, 19, 21, 24, 27, 30, 31, 33, 38, 40, 47, 48, 55], "tiledb": [8, 12, 15, 17, 21, 22, 23, 24, 25, 31, 33, 34, 41, 49, 56], "issu": [8, 19, 21, 22, 36], "1528": 8, "x_layer": [9, 19], "obsm_lay": [9, 36, 38, 40, 42], "column_nam": [9, 17, 19, 20, 25, 34, 36, 37, 41, 42, 43, 45, 46, 47, 48, 49, 50], "axiscolumnnam": 9, "obsm": [9, 22, 26, 35, 36, 38, 40], "slot": [9, 22, 36], "brain": [9, 19, 25, 34, 43], "tissu": [9, 17, 19, 20, 22, 25, 28, 31, 32, 38, 39, 41, 42, 43, 45, 46, 47, 49, 52], "censusversiondescript": [10, 11], "descript": [10, 11, 21, 24, 26, 28, 30, 33, 47, 49, 54], "directori": [10, 11, 23, 27, 29, 55], "dictionari": [10, 11, 12, 15, 27, 29, 34, 38, 47, 49], "unknown": [10, 37, 48, 49], "get_census_version_directori": 10, "entir": [10, 37, 41, 44, 53], "dict": [10, 11, 12, 15, 36, 40], "latest": [10, 11, 15, 19, 23, 29, 31, 34, 35, 41, 44, 47, 48, 49], "release_d": [10, 11, 29], "release_build": [10, 11, 29], "2022": [10, 11, 14, 15, 28, 44, 45], "12": [10, 11, 14, 15, 19, 29, 34, 35, 36, 37, 38, 39, 40, 42, 44, 46, 47, 49], "01": [10, 11, 14, 35, 39, 42, 47], "uri": [10, 11, 12, 14, 15, 20, 27, 29, 36, 38, 40, 45, 47, 54], "s3": [10, 11, 12, 14, 15, 20, 21, 23, 27, 28, 29, 36, 38, 40, 45, 47, 55], "public": [10, 11, 14, 20, 22, 27, 28, 29, 36, 38, 40, 45, 47, 48], "s3_region": [10, 11, 14, 27, 29, 45], "u": [10, 11, 12, 14, 15, 20, 21, 23, 24, 27, 29, 33, 37, 43, 45, 47, 55], "west": [10, 11, 14, 15, 20, 21, 23, 27, 29, 45, 47, 55], "lt": [11, 19, 20, 29, 35, 42, 44], "retract": [11, 29], "flag": [11, 29, 53], "both": [11, 17, 19, 21, 28, 30, 31, 35, 36, 46, 47, 49, 51, 53], "long": [11, 17, 20, 24, 29, 30, 31, 33, 53], "term": [11, 20, 24, 28, 29, 33, 34, 41, 43, 48, 53], "weekli": [11, 20, 24, 29, 33], "exclud": [11, 28, 37, 46, 53], "either": [11, 14, 20, 21, 28, 53], "date": [11, 20, 22, 26, 28, 29, 34, 47], "yyyi": [11, 22, 29, 30], "mm": [11, 22, 29], "dd": [11, 22, 29, 30], "alias": 11, "alia": [11, 29], "appear": [11, 28, 29, 34, 36, 53], "under": [11, 27, 28, 29, 31, 37, 39, 42], "again": [11, 48], "v": [11, 29, 35, 43], "most": [11, 18, 21, 22, 28, 34, 35, 36, 37, 38, 41, 46, 51, 53, 56], "recent": [11, 17, 22], "sequenti": 11, "increment": [11, 18, 32], "get_census_version_descript": 11, "census_version_nam": 11, "11": [11, 21, 23, 28, 34, 35, 36, 37, 38, 39, 40, 42, 44, 45, 46, 47, 48, 49, 52, 53, 55], "29": [11, 37, 38, 53], "v2": [11, 28, 34, 35, 37, 48, 52], "v1": [11, 16, 19, 26, 27, 28, 29, 34, 35, 37], "10": [11, 21, 22, 25, 30, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 52, 53], "15": [11, 20, 29, 30, 34, 35, 36, 37, 38, 39, 40, 42, 44, 46, 47, 48, 52], "30": [11, 22, 28, 35, 37, 38, 47, 53], "mistak": 11, "info_url": 11, "errata": 11, "replaced_bi": [11, 29], "tiledb_config": [12, 15, 20, 47], "somatiledbcontext": [12, 15, 47], "sensibl": 12, "custom": [12, 15, 20], "context": [12, 15, 19, 20, 25, 28, 34, 37, 41, 46, 47], "somaobject": 12, "open": [12, 14, 15, 17, 18, 19, 20, 22, 24, 25, 31, 33, 35, 37, 38, 42, 47, 48, 51, 56], "replac": [12, 29, 36, 38, 40], "configur": [12, 15, 20, 21, 53], "overrid": [12, 15], "amount": [12, 48, 50], "ctx": [12, 20, 47], "py": [12, 15, 35, 37, 39, 48], "init_buffer_byt": [12, 15], "128": [12, 15, 22, 37, 51, 53], "1024": [12, 15], "c": [12, 17, 19, 23, 25, 35, 37, 38, 39, 40, 44, 45, 55], "my": [12, 20], "privat": [12, 20], "bucket": [12, 15, 20, 21, 23, 28, 29], "access": [12, 14, 21, 22, 24, 25, 26, 27, 28, 30, 31, 32, 33, 34, 36, 39, 41, 49, 50, 53, 56], "differ": [12, 21, 28, 34, 35, 36, 42, 44, 46, 47, 49], "region": [12, 14, 20, 21, 23, 27, 29, 47, 55], "vf": [12, 20, 47], "no_sign_request": [12, 20, 47], "east": [12, 20], "experiment": [12, 18, 23, 28, 32, 36, 38, 47, 52, 53], "presenc": [13, 26, 30, 31, 32, 36, 37, 39], "deafult": 13, "csr_arrai": 13, "cannot": [13, 15, 28], "321x60554": 13, "numpi": [13, 21, 24, 31, 33, 35, 36, 37, 38, 39, 40, 43, 44, 53], "uint8": [13, 44], "6441269": 13, "compress": [13, 42, 44], "format": [13, 20, 28, 29, 30, 43, 44, 54], "censusloc": 14, "guarante": [14, 24, 28, 33, 34, 35, 42], "interest": [14, 24, 26, 33, 34, 36, 44, 46, 48], "keyerror": 14, "do": [14, 19, 23, 25, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 45, 47, 49, 50, 52, 55], "cb5efdb0": 14, "f91c": 14, "4cbd": 14, "9ad4": 14, "9d4fa41c572d": 14, "mirror": 15, "suitabl": [15, 47], "chosen": [15, 27], "automat": [15, 21, 31, 34, 41], "take": [15, 18, 34, 35, 37, 38, 39, 42, 46, 47, 48, 49, 53, 55, 56], "preced": 15, "get_default_soma_context": [15, 20], "level": [15, 26, 28, 29, 30, 31, 34, 38, 43, 45, 46, 48, 50, 51], "It": [15, 21, 22, 26, 28, 30, 31, 34, 47, 51], "manag": [15, 19, 25, 34, 41, 50, 51], "close": [15, 17, 18, 19, 25, 34, 35, 36, 37, 39, 41, 42, 45, 47, 49, 50], "exit": 15, "neither": 15, "invalid": [15, 43], "updat": [15, 18, 21, 28, 30, 35, 37, 39, 43, 47, 48], "specif": [15, 21, 22, 24, 26, 29, 33, 34, 36, 41, 43, 46, 49], "31": [15, 37, 38, 53], "rather": [15, 37, 43], "than": [15, 17, 19, 21, 23, 24, 25, 28, 30, 33, 34, 36, 37, 43, 56], "packag": [16, 21, 23, 24, 25, 30, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 47, 48, 49, 51, 52, 55], "out": [16, 19, 21, 22, 24, 26, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 47, 48, 49, 50, 53, 55, 56], "effici": [16, 19, 21, 24, 31, 32, 33, 46, 48, 56], "implement": [16, 21, 24, 28, 33, 43, 51, 53, 56], "commonli": [16, 48], "normal": [16, 20, 22, 24, 25, 26, 30, 31, 32, 33, 34, 36, 40, 47, 49, 51, 52], "pre": [16, 18, 21, 29, 32, 34, 38, 46, 47], "publish": [17, 18, 19, 21, 22, 24, 28, 30, 33], "august": [17, 30], "7th": 17, "2023": [17, 18, 19, 20, 24, 25, 27, 28, 29, 30, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53], "By": [17, 18, 19, 30, 34, 39, 48], "pablo": [17, 18, 19, 30], "garcia": [17, 18, 19, 30], "nieto": [17, 18, 19, 30], "team": [17, 18, 19, 21, 30], "announc": [17, 18, 19, 30], "come": [17, 25, 30, 35, 36, 37], "our": [17, 19, 21, 25, 30, 34, 35, 36, 38, 40, 42, 47], "back": [17, 30, 35, 38, 53], "now": [17, 18, 19, 25, 30, 31, 34, 35, 37, 38, 39, 42, 44, 45, 46, 47, 49, 52, 53, 55], "biologist": 17, "largest": [17, 21, 30], "standard": [17, 21, 24, 26, 33, 41, 43], "aggreg": [17, 30], "compos": [17, 26, 30], "60k": [17, 21, 30], "With": [17, 18, 19, 30, 34, 36, 39, 42, 47, 49, 53], "few": [17, 18, 32, 36, 38, 39, 46, 47, 48, 55], "hundr": [17, 30], "bigger": [17, 30], "quickli": [17, 22, 34, 35], "basic": [17, 35, 36, 37, 38, 39, 41, 42, 45, 47, 53], "structur": [17, 24, 29, 33, 34, 36], "downstream": [17, 18, 19, 25, 47], "analysi": [17, 19, 25, 28, 30, 32, 34, 35, 36, 37, 39, 41, 46, 47], "instruct": [17, 21, 25], "learn": [17, 28, 31, 35, 36, 39, 41, 46, 47, 49], "sure": [17, 39], "resourc": [17, 27, 37], "quick": [17, 20, 21, 24, 32, 33, 34, 50, 53], "start": [17, 20, 21, 22, 24, 32, 33, 34, 35, 37], "guid": [17, 20, 31, 35], "refer": [17, 19, 20, 21, 25, 28, 30, 35, 36, 38, 40, 49], "tutori": [17, 18, 21, 22, 24, 25, 33, 36, 37, 38, 39, 40, 42, 43, 45, 46, 47, 49, 50, 51, 52, 53], "reli": 17, "capabl": [17, 30, 32, 36, 44, 56], "shown": [17, 28, 29, 34, 36, 42, 53], "section": [17, 20, 28, 34, 37, 38, 42, 46, 47], "czi": [17, 21, 24, 33, 54], "develop": [17, 22, 23, 30, 35, 37, 48], "upgrad": [17, 21, 48], "beta": [17, 34, 37, 38], "here": [17, 18, 21, 24, 25, 26, 28, 29, 31, 33, 35, 36, 46, 47, 48, 53], "ever": 17, "grow": 17, "cz": [17, 21, 22, 26, 32, 37, 39, 45, 46], "discov": [17, 21, 22, 26, 31, 34, 37, 38, 42, 45, 46, 47, 54], "accompani": 17, "ontologi": [17, 38, 48], "map": [17, 28, 34, 37, 38, 40, 43, 44, 45], "cl": [17, 28, 34, 37, 38, 41, 49, 50, 52], "uberon": [17, 28, 34, 37, 41, 48, 49, 50, 52], "you": [17, 19, 21, 22, 23, 24, 25, 26, 31, 32, 33, 34, 35, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50, 53, 55], "find": [17, 19, 22, 26, 31, 34, 36, 38, 39, 40, 41, 42, 44, 47, 51], "schema": [17, 19, 20, 21, 22, 29, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50], "page": [17, 20, 21, 22, 25, 26, 35, 36, 38, 40, 42, 47, 56], "research": [17, 19, 21, 24, 33], "session": [17, 20, 23], "librari": [17, 21, 22, 23, 25, 26, 28, 34, 37, 53], "your": [17, 19, 21, 23, 24, 32, 33, 41, 45, 46, 47, 50], "navig": 17, "human": [17, 19, 25, 26, 28, 29, 31, 32, 35, 36, 38, 41, 42, 44, 45, 46, 49, 50], "300k": [17, 25], "microgli": [17, 20, 25], "neuron": [17, 19, 20, 25, 34, 38, 44, 50], "femal": [17, 20, 25, 37, 46, 48, 49, 52], "donor": [17, 28, 37, 44, 45, 48], "somadatafram": [17, 25, 34, 41, 49], "cell_metadata": [17, 20, 25], "homo_sapien": [17, 18, 19, 20, 25, 26, 28, 34, 36, 37, 38, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 53], "arrow": [17, 19, 21, 24, 25, 30, 33], "tabl": [17, 19, 25, 26, 32, 35, 36, 37, 39, 43, 44, 46], "sex": [17, 19, 20, 22, 25, 28, 34, 42, 43, 45, 46, 47, 48, 49, 52], "cell_typ": [17, 18, 19, 20, 25, 28, 34, 35, 36, 37, 38, 39, 40, 41, 42, 45, 46, 47, 48, 49, 50, 52, 53], "assai": [17, 20, 22, 25, 35, 36, 39, 42, 45, 47, 48, 49, 50, 52], "suspension_typ": [17, 20, 25, 28, 31, 34, 37, 42, 45, 47, 48, 49, 52], "diseas": [17, 20, 22, 25, 28, 35, 36, 42, 45, 46, 47, 48, 49, 52], "concat": [17, 18, 25, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 49, 50, 51, 52], "tibbl": [17, 25], "frame": [17, 20, 21, 24, 25, 26, 33, 34, 44], "similarli": [17, 19, 25, 34, 44, 49], "gene_filt": [17, 18, 19, 25], "feature_id": [17, 18, 19, 25, 28, 34, 37, 38, 40, 42, 43, 44, 45, 47, 48, 49, 51], "ensg00000107317": [17, 19, 25], "ensg00000106034": [17, 19, 25], "cell_filt": [17, 18, 19, 25], "leptomening": 17, "cell_column": [17, 19, 25], "seurat_obj": [17, 19, 25], "get_seurat": [17, 19, 25], "sce_obj": [17, 19, 25], "get_single_cell_experi": [17, 19, 25], "sometim": 17, "too": 17, "overview": [17, 26, 50], "septemb": 18, "18": [18, 34, 35, 37, 38, 40, 42, 47, 52], "thrill": 18, "offici": [18, 28], "wide": [18, 20, 24, 33, 36, 44], "algorithm": [18, 36, 51, 52], "line": [18, 28, 34, 38, 40, 53], "code": [18, 19, 31, 43, 48, 50, 53], "task": [18, 21, 36], "ten": 18, "convent": [18, 29, 34], "laptop": 18, "8gb": 18, "below": [18, 19, 25, 28, 29, 30, 34, 37, 38, 42, 44, 50, 53], "full": [18, 20, 24, 26, 29, 30, 31, 32, 33, 35, 36, 42, 49, 50, 53], "correct": [18, 22, 53], "These": [18, 19, 21, 24, 27, 28, 31, 33, 34, 36, 37, 38, 40], "interwoven": 18, "seamlessli": 18, "appli": [18, 36, 39, 40], "33m": [18, 21], "continu": [18, 25], "cellxgene_censu": [18, 19, 20, 22, 25, 31, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 48, 49, 50, 51, 52, 53, 54, 55], "pp": [18, 35, 36, 37, 38, 39, 40, 42, 47, 51, 52], "mean_vari": [18, 52], "small": [18, 19, 30, 34, 36, 37, 39, 41, 43, 48, 49], "advantag": [18, 42, 47], "cpu": [18, 35, 38, 53], "multiprocess": 18, "popul": 18, "futur": [18, 22, 25, 27, 34, 35, 37, 38, 39, 41, 43, 44, 45, 46, 48, 49, 50, 51, 52, 53], "we": [18, 19, 21, 24, 25, 27, 31, 33, 34, 35, 36, 37, 38, 39, 40, 42, 43, 44, 46, 47, 48, 49, 52, 53], "enabl": [18, 21, 22, 28, 48], "easili": [18, 19, 21, 39, 42], "switch": [18, 48], "import": [18, 19, 20, 22, 25, 30, 31, 34, 35, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 55], "human_data": 18, "feature_nam": [18, 25, 28, 34, 36, 37, 42, 43, 44, 45, 46, 47, 48, 49, 51], "mean_variance_df": 18, "gene_df": 18, "to_panda": [18, 25, 34, 35, 36, 37, 39, 41, 42, 43, 44, 45, 46, 47, 49, 50, 51, 52], "8624": 18, "071926": 18, "5741": 18, "242485": 18, "16437": 18, "233282": 18, "452": 18, "119153": 18, "feature_length": [18, 25, 28, 34, 35, 37, 39, 42, 43, 44, 45, 47, 48, 49, 51], "ensg00000171885": 18, "5943": 18, "ensg00000133703": 18, "6845": 18, "get_highly_variable_gen": 18, "while": [18, 25, 34, 36, 38, 42, 47, 51], "account": [18, 35, 53], "effect": [18, 19, 35, 36, 47], "integr": [18, 21, 24, 31, 33, 36, 37], "particular": [18, 36, 53], "design": [18, 48], "same": [18, 19, 25, 26, 36, 38, 39, 42, 45, 46, 47, 49, 51], "paradigm": [18, 24, 33], "abov": [18, 21, 25, 26, 28, 34, 38, 46, 48, 49, 50], "tweak": 18, "compli": 18, "rule": 18, "thumb": 18, "good": [18, 36, 39, 47], "variances_norm": [18, 51], "003692": 18, "004627": 18, "748221": 18, "003084": 18, "003203": 18, "898657": 18, "014962": 18, "037395": 18, "513473": 18, "218865": 18, "547648": 18, "786928": 18, "002142": 18, "002242": 18, "894955": 18, "60659": [18, 37, 44], "000000": [18, 36, 43, 51], "60660": [18, 37, 44], "60661": [18, 37, 44], "60662": [18, 37, 44], "60663": [18, 37, 44], "octob": 19, "maximilian": 19, "lombardo": 19, "happi": 19, "introduct": 19, "tailor": 19, "empow": 19, "express": [19, 21, 28, 35, 36, 40, 42, 43, 47], "reflect": [19, 28, 36], "expand": [19, 36, 43], "exclus": [19, 28], "thei": [19, 28, 29, 35, 36, 42, 43, 44, 46, 47], "invit": 19, "feedback": 19, "explor": [19, 21, 24, 31, 32, 33], "novel": [19, 37], "were": [19, 21, 26, 28, 34, 35, 36, 37, 39, 44, 46, 47], "mous": [19, 26, 28, 31, 34, 39, 43, 45, 46, 49, 51, 52], "divid": [19, 43, 46], "sum": [19, 28, 36, 37, 38, 40, 41, 43, 45, 53], "point": [19, 26, 29, 36, 43], "precis": [19, 42, 47], "round": 19, "sigma": 19, "artifact": [19, 27, 28, 36], "m": [19, 23, 26, 34, 37, 38, 39, 40, 44, 49, 51, 55], "enrich": 19, "field": [19, 27, 28, 47, 56], "n_measured_ob": [19, 28, 42, 47], "wa": [19, 28, 36, 39, 40, 44, 45, 47, 48, 53], "augment": 19, "forego": 19, "common": [19, 25, 36, 41, 47, 49, 51, 53], "earli": 19, "raw_sum": [19, 28, 42, 43, 47], "deriv": [19, 38, 39, 47], "raw_mean_nnz": [19, 28, 42, 47], "averag": 19, "raw_variance_nnz": [19, 28, 42, 47], "n_measured_var": [19, 28, 42, 47], "thu": [19, 21, 24, 28, 31, 33, 35, 38, 41, 42, 49], "ensg00000161798": [19, 25, 49], "ensg00000188229": [19, 25, 49], "sympathet": [19, 25], "singlecellexperi": [19, 23, 24, 30, 33], "outlin": 19, "like": [19, 21, 27, 30, 34, 36, 37, 38, 41, 42, 47, 53], "male": [19, 25, 37, 38, 43, 48, 49, 50, 52], "pyarrow": [19, 21, 24, 25, 33, 43, 46], "raw_slic": [19, 25], "equival": [19, 42, 43, 47], "somaaxisqueri": [19, 25], "read_next": [19, 25], "print": [19, 25, 36, 41, 44, 45, 46, 48, 53, 55], "encourag": [19, 24, 33], "engag": 19, "share": [19, 21, 24, 33], "input": [19, 43, 49, 53], "invalu": 19, "ongo": 19, "project": [19, 23, 32, 36], "reach": [19, 24, 33, 35], "report": [19, 22, 36, 48], "repositori": [19, 21, 24, 28, 33, 47, 55], "amazon": [20, 21], "web": [20, 21], "servic": [20, 21, 27], "describ": [20, 26, 28, 29, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 47, 49, 50, 51, 52], "what": [20, 27, 28, 31, 34, 35, 36, 37, 46, 49], "inclus": [20, 28, 41], "criteria": [20, 21, 25, 26, 28, 49], "individu": [20, 28, 34, 35, 39, 46], "root": [20, 28, 29, 55], "definit": [20, 35, 49], "publicli": [20, 21, 22, 24, 29, 33, 56], "uniqu": [20, 21, 22, 28, 34, 35, 36, 37, 41, 43, 46], "05": [20, 29, 30, 46, 48, 53], "bulk": 20, "07": [20, 25, 27, 29, 34, 35, 37, 39, 41, 43, 44, 45, 48, 49, 50, 51, 52, 53], "25": [20, 25, 27, 34, 35, 36, 37, 38, 39, 41, 43, 44, 45, 48, 49, 50, 51, 52, 53], "shell": [20, 38, 40, 45], "sync": [20, 38, 40], "sign": [20, 36], "recommend": [20, 21, 23, 25, 28, 29, 35, 36, 38, 40, 46, 48, 55, 56], "folder": [20, 29, 30, 31, 40], "interact": [20, 24, 33], "document": [20, 21, 25, 28, 29, 31, 34, 35, 39, 41, 47, 49, 56], "last": [21, 22, 28, 29], "jan": 21, "2024": [21, 24, 33], "latenc": [21, 24, 33], "acceler": [21, 24, 33], "50m": 21, "mice": 21, "harmon": [21, 24, 30, 33], "label": [21, 28, 29, 34, 36, 37, 38, 40, 46, 48, 50, 53], "multi": [21, 26, 32, 37, 47], "core": [21, 32, 35, 43], "k": [21, 36], "onlin": [21, 22, 24, 29, 33, 52, 56], "t": [21, 35, 37, 38, 39, 40, 41, 45, 46, 49, 50], "covid": [21, 34, 37, 46, 49], "19": [21, 22, 34, 35, 37, 38, 40, 41, 42, 44, 46, 47, 49], "suit": 21, "author": [21, 28], "spatial": [21, 26, 28, 35, 36, 37, 44, 45], "yet": [21, 23], "d": [21, 42, 47, 55], "click": [21, 25], "indic": [21, 26, 28, 31, 34, 36, 37, 39, 43, 44, 47, 49], "citat": [21, 24, 28, 33], "guidelin": [21, 24, 33], "offer": [21, 24, 33, 36, 42, 47, 56], "becaus": [21, 35, 37, 39, 46], "therefor": [21, 35, 39, 41, 46, 47], "numer": [21, 36], "incompat": [21, 28], "purpos": 21, "suggest": [21, 36], "fast": 21, "corpu": 21, "60": [21, 38, 46], "gencod": 21, "readi": [21, 38, 53], "cloud": [21, 23, 24, 27, 33, 45, 56], "matric": [21, 24, 25, 26, 33, 34, 36, 43], "possibl": [21, 28, 31, 38, 49], "due": [21, 34, 36, 43, 53], "free": [21, 48], "aw": [21, 23, 27, 38, 40, 45, 55], "ye": 21, "download_source_h5ad": [21, 45], "help": [21, 25, 31, 34, 39, 41, 47, 48, 49, 51, 53], "pattern": [21, 36, 42], "internet": [21, 23, 48], "limit": [21, 34, 46], "bandwidth": [21, 46, 55], "tactic": 21, "connect": [21, 23, 37, 38, 48, 50, 55], "high": [21, 26, 28, 34, 36, 37, 38, 46, 48, 51, 55], "ethernet": 21, "wifi": 21, "coast": 21, "ec2": [21, 23], "instanc": [21, 23, 28, 36, 41, 48, 55], "There": [21, 23, 37, 38, 41, 42, 44, 46, 47, 51], "howev": [21, 35, 36, 37, 53], "environ": [21, 23], "census_env": 21, "activ": [21, 23, 25, 47, 55], "submit": [21, 24, 33], "join": [21, 24, 33, 34, 37, 43, 45, 49, 51], "scienc": [21, 24, 33, 44, 54], "commun": [21, 24, 33, 36, 42, 47], "slack": [21, 24, 30, 33], "co": [21, 24, 33], "question": [21, 34], "channel": [21, 24, 30, 33], "inquir": 21, "accept": [21, 51], "meet": [21, 25, 49, 51], "biolog": [21, 32, 46, 47, 53], "try": [21, 53], "old": [21, 37, 52], "persist": [21, 26], "notebook": [21, 23, 30, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 47, 48, 53, 55], "sh": [21, 23], "restart": 21, "runtim": 21, "reload": [21, 38], "numba": [21, 43], "relat": [21, 29], "magic": 21, "similar": [21, 34, 35, 36, 37, 40, 49, 50, 51], "dbutil": 21, "restartpython": 21, "addition": [21, 35, 36], "node": [21, 34], "cluster": [21, 32, 35, 40], "0d53f00001ghvp3cap": 21, "between": [21, 28, 36, 38], "altern": [21, 53], "ad": [21, 28, 30, 36, 47, 48, 49], "tab": 21, "edit": [22, 28, 29], "decemb": [22, 28], "15th": [22, 24, 33], "stabil": 22, "scientif": 22, "reproduc": [22, 35, 48, 50], "plan": [22, 24, 33], "regular": 22, "everi": [22, 24, 33], "six": [22, 24, 33], "month": [22, 24, 29, 30, 33, 52], "least": [22, 24, 28, 33], "year": [22, 24, 29, 30, 33, 37], "recogn": 22, "previou": [22, 27, 35, 37, 42, 47], "ingest": [22, 46], "hand": 22, "week": [22, 49], "651": 22, "62": [22, 37, 38, 40, 46], "998": 22, "417": 22, "684": 22, "805": 22, "36": [22, 34, 38, 53], "227": [22, 51], "903": 22, "230": 22, "588": [22, 37, 44, 45], "990": 22, "categori": [22, 28, 34, 37, 38, 50], "20": [22, 34, 35, 37, 38, 40, 44, 47, 52, 55], "631": 22, "248": [22, 34, 41], "stage": [22, 37, 48, 49, 52], "173": [22, 51], "72": [22, 38], "self": [22, 30, 31, 35, 43, 48, 53], "ethnic": [22, 48], "na": [22, 28, 34, 50, 52], "suspens": [22, 35, 48], "74": [22, 38], "53": [22, 38], "27": [22, 34, 35, 37, 38, 44, 53], "scvi": [22, 31, 32, 36, 55], "fine": [22, 42, 55], "geneform": [22, 32, 36], "593": [22, 37, 44, 45], "56": [22, 37, 38], "400": 22, "873": 22, "255": 22, "245": [22, 44], "33": [22, 37, 38, 47, 53], "364": 22, "242": 22, "083": 22, "531": [22, 37], "13": [22, 34, 35, 37, 38, 39, 42, 46, 47], "035": 22, "613": [22, 34, 41, 50], "164": 22, "64": [22, 34, 38], "26": [22, 34, 35, 37, 38, 44, 53], "220": [22, 34, 41, 44], "66": [22, 34, 38, 41], "54": [22, 34, 38], "prevent": [22, 47], "analys": [22, 48], "mark": [22, 28, 34, 36, 46], "is_primari": 22, "exactli": [22, 28], "243": [22, 34, 44], "569": 22, "twice": [22, 34], "wish": [22, 34, 51], "consid": [22, 35], "duplicate_cells_census_lts_2023": 22, "csv": [22, 48], "zip": [22, 40, 43], "562": 22, "794": 22, "728": 22, "086": 22, "032": 22, "758": 22, "887": 22, "914": 22, "318": 22, "493": 22, "362": 22, "604": 22, "226": 22, "68": [22, 38], "51": [22, 37, 38], "61": [22, 38], "linux": [23, 55], "maco": [23, 55], "system": [23, 34, 36, 42, 45, 47, 55], "Or": 23, "tbd": 23, "16": [23, 34, 35, 37, 38, 39, 40, 42, 47, 48, 52, 53], "gb": [23, 48], "mbp": [23, 48], "increas": [23, 24, 33, 48], "virtual": [23, 55], "conda": 23, "venv": [23, 35, 37, 39, 55], "bin": [23, 55], "modul": [23, 31, 32, 35, 53], "less": [23, 36, 53], "complex": [23, 34, 36, 41, 43, 44], "databrick": 23, "faq": [23, 24, 33], "ubuntu": [23, 55], "apt": 23, "libxml2": 23, "dev": 23, "libssl": 23, "libcurl4": 23, "openssl": 23, "cmake": 23, "21": [23, 35, 37, 38, 39, 40, 44, 46, 49, 52], "greater": [23, 28], "tool": [23, 31, 36, 40, 48, 55], "xcode": 23, "window": [23, 53], "univers": [23, 36, 47], "cran": 23, "abl": [23, 27], "export": [23, 30, 42, 56], "biocmanag": 23, "quietli": 23, "ve": [24, 33], "central": [24, 33, 42, 47], "hub": [24, 33], "embed": [24, 33, 35, 40], "analyz": [24, 33], "significantli": [24, 33], "minim": [24, 33, 36], "scale": [24, 33, 35, 37, 38, 39], "interoper": [24, 33, 48], "toolkit": [24, 32, 33], "smart": [24, 26, 28, 31, 33, 34, 37, 44, 45, 50, 52], "seq2": [24, 26, 28, 31, 33, 34, 37, 39, 44, 45, 50, 52], "molecul": [24, 26, 33], "10x": [24, 25, 26, 28, 31, 33, 34, 36, 37, 40, 44, 45, 46, 48, 49, 52], "duplic": [24, 26, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 47, 49, 50], "five": [24, 33], "without": [24, 28, 29, 33, 36, 53], "perman": [24, 33], "ask": [24, 33], "email": [24, 30, 33, 47], "believ": [24, 33], "secur": [24, 33], "disclos": [24, 33], "contact": [24, 33], "seamless": [24, 33], "pytorch": [24, 32, 33], "usabl": [24, 33, 53], "area": [24, 33], "On": [24, 33], "demand": [24, 25, 33], "rich": [24, 33, 35], "subsampl": [24, 33], "vignett": [25, 40], "soon": 25, "remind": [25, 42, 44, 47], "etc": [25, 26, 31, 34], "output": [25, 43, 53], "consist": [25, 31, 34, 35, 36, 37, 39, 41, 43, 44, 45, 46, 48, 49, 50, 51, 52, 53], "ey": [25, 44], "379219": 25, "microwel": [25, 28, 34, 37, 49], "seq": [25, 28, 34, 35, 37, 49, 50], "adren": [25, 34], "gland": [25, 34, 38, 46, 47, 50], "379220": 25, "379221": 25, "379222": 25, "379223": 25, "379224": 25, "7": [25, 34, 35, 36, 37, 38, 39, 40, 42, 44, 45, 46, 47, 48, 49, 53], "n_var": [25, 37, 39, 42, 43, 44, 45, 47, 48, 49], "demonstr": [25, 31, 32, 34, 35, 36, 40, 42, 43, 45, 47, 48, 51, 53], "initi": [25, 28, 40, 42, 46, 47], "lazi": [25, 42, 46, 47], "evalu": 25, "well": [25, 28, 34, 35, 37, 46, 50], "logic": [25, 37], "wrap": [25, 43, 53], "loop": 25, "r6": 25, "familiar": [25, 28, 35, 37, 39, 53, 56], "379": 25, "224": 25, "chr": 25, "fema": 25, "6": [25, 27, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 53], "\u2139": 25, "214": 25, "smaller": [25, 53], "4k": 25, "4744": 25, "sampl": [25, 37, 38, 40, 43], "bioconductor": 25, "ecosystem": 25, "dim": 25, "rownam": 25, "rowdata": 25, "colnam": 25, "obs48350835": 25, "obs48351829": 25, "obs52469564": 25, "obs52470190": 25, "coldata": 25, "reduceddimnam": 25, "mainexpnam": 25, "altexpnam": 25, "sparse_matrix": 25, "state": [25, 36, 37, 44, 45], "monitor": 25, "read_complet": 25, "friendli": 26, "varieti": [26, 36, 41, 43, 47], "hierarchi": 26, "somacollect": [26, 34, 41, 55], "item": [26, 34, 41, 45, 53], "whole": [26, 28, 34, 37], "summary_cell_count": [26, 34, 37, 50], "stratifi": [26, 34, 38], "relev": [26, 28, 32, 34, 49], "independ": [26, 34], "somaexperi": [26, 34, 43], "special": [26, 28, 34, 49], "form": [26, 34, 44, 53], "how": [26, 31, 32, 34, 36, 37, 39, 42, 46, 47, 50, 53], "avialbl": 26, "feature_dataset_presence_matrix": [26, 37, 39], "boolean": [26, 28, 37, 39, 44], "adher": 26, "technologi": [26, 28, 31, 34, 35, 37, 39], "short": [26, 30, 34], "densendarrai": 26, "dimension": [26, 28, 36, 37], "offset": 26, "sparsendarrai": [26, 42, 47], "primari": [26, 28, 31, 36, 38, 50], "observ": [26, 28, 35, 43, 46, 48, 50], "varm": 26, "geograph": 27, "json": [27, 36, 38, 40, 47], "cziscienc": [27, 38, 40, 47, 48], "base_uri": 27, "three": [27, 48, 49], "gc": [27, 40], "rememb": [27, 34, 46], "relative_uri": 27, "hood": 27, "cloudfront": 27, "registri": 27, "resolv": 27, "against": 27, "onward": 27, "togeth": [27, 53], "could": [27, 36, 40, 53], "word": [28, 29, 31, 36, 43, 44, 47], "NOT": [28, 29, 43, 44], "shall": [28, 29], "interpret": [28, 29, 36], "bcp": [28, 29], "14": [28, 29, 34, 35, 37, 38, 39, 42, 44, 47], "rfc2119": [28, 29], "rfc8174": [28, 29], "capit": [28, 29], "hereaft": 28, "visit": [28, 36, 54], "understand": [28, 31, 32, 36], "reader": [28, 31, 42], "throughout": [28, 38, 40, 46, 47], "serv": [28, 39], "deposit": [28, 29, 31], "heart": [28, 44, 46, 51], "left": [28, 30, 31, 35, 37], "ventricl": [28, 41], "semver": 28, "major": [28, 37], "delet": 28, "modal": 28, "minor": 28, "compat": 28, "patch": 28, "editori": 28, "separ": [28, 36, 46, 48, 51], "impos": 28, "organism_ontology_term_id": 28, "ncbitaxon": 28, "10090": 28, "9606": 28, "feature_refer": 28, "show": [28, 31, 32, 34, 36, 38, 39, 43, 46, 53], "AND": 28, "assay_ontology_term_id": [28, 31, 34, 37, 41, 42, 45, 47, 48, 49, 52], "id": [28, 34, 35, 36, 38, 39, 40, 43, 47, 48], "efo": [28, 34, 35, 37, 49, 50, 52], "0030003": [28, 34, 37], "transcript": [28, 34, 37], "profil": [28, 34, 37], "0009901": [28, 34], "0009899": [28, 34, 37, 52], "0009922": [28, 34, 49], "0030004": [28, 34], "0011025": [28, 34], "0009900": [28, 34], "0700004": [28, 34], "bd": [28, 34, 37], "rhapsodi": [28, 34, 37], "target": [28, 34], "mrna": [28, 34], "0700003": [28, 34], "transcriptom": [28, 34, 35, 37, 39, 44, 45, 46], "0010010": [28, 34], "cel": [28, 34], "0008720": 28, "dronc": 28, "0008722": [28, 34, 37, 50], "drop": [28, 34, 37, 38, 43, 50], "0700011": 28, "gexscop": 28, "0008780": [28, 34, 50], "indrop": [28, 34, 37, 50], "0008796": 28, "mar": 28, "0030002": [28, 34, 49], "0010550": [28, 34], "sci": [28, 34, 37], "0008919": [28, 34, 50], "0030019": 28, "0008930": 28, "0700016": 28, "v4": 28, "0008931": [28, 34, 50, 52], "0008953": [28, 34], "strt": [28, 34], "0700010": 28, "trudrop": 28, "ration": 28, "0030059": 28, "multiom": [28, 37, 44, 45], "atac": 28, "0030007": 28, "scatac": 28, "0008992": 28, "merfish": 28, "0008853": 28, "certainti": 28, "0010891": 28, "0030026": 28, "plex": 28, "lack": [28, 36], "proper": [28, 31, 35], "0030062": 28, "slide": 28, "seqv2": 28, "0030027": 28, "snmc": 28, "0010961": 28, "visium": 28, "umi": 28, "tissue_ontology_term_id": [28, 34, 37, 41, 42, 45, 47, 48, 49, 52], "ontology_term_id": [28, 34, 37, 50], "organoid": 28, "referenc": [28, 37], "whose": [28, 37, 49], "readabl": [28, 29, 31, 37], "census_schema_vers": [28, 34], "census_build_d": [28, 34], "iso": [28, 29, 47], "8601": [28, 29], "dataset_schema_vers": [28, 34], "total_cell_count": [28, 34, 37, 50], "unique_cell_count": [28, 34, 37, 50], "number_donors_homo_sapien": [28, 34], "number_donors_mus_musculu": [28, 34], "10000": [28, 36], "100": [28, 34, 35, 37], "collection_id": [28, 35, 39, 44, 45], "quot": 28, "collection_nam": [28, 31, 35, 37, 39, 44, 45], "collection_doi": [28, 35, 39, 44, 45], "dataset_titl": [28, 31, 35, 37, 39, 44, 45], "dataset_h5ad_path": [28, 35, 39, 44, 45], "rel": [28, 39, 52], "storag": [28, 56], "dataset_total_cell_count": [28, 35, 39, 44, 45], "dataset_version_id": 28, "self_reported_ethn": [28, 34, 37, 42, 45, 47, 48, 49], "0002048": [28, 37, 41], "cell_type_a": 28, "xxxxx": 28, "cell_type_n": 28, "assay_a": 28, "assay_n": 28, "tissue_a": 28, "tissue_n": 28, "tissue_general_a": 28, "tissue_general_n": 28, "disease_a": 28, "mondo": [28, 37], "disease_n": 28, "self_reported_ethnicity_a": 28, "hancestro": [28, 49], "self_reported_ethnicity_n": 28, "sex_a": 28, "pato": [28, 37, 49, 52], "sex_n": 28, "suspension_type_a": 28, "suspension_type_n": 28, "somameasur": 28, "somaindexeddatafram": 28, "float32": [28, 39, 42, 43, 47], "fill": [28, 47], "variant": 28, "feature_biotyp": 28, "pin": 28, "clarifi": 28, "feature_1": 28, "feature_m": 28, "dataset_soma_joinid_1": 28, "dataset_soma_joinid_n": 28, "tissue_general_ontology_term_id": [28, 34, 37, 42, 45, 47, 48, 49, 52], "cell_type_ontology_term_id": [28, 34, 37, 41, 42, 45, 47, 48, 49, 50, 52], "development_stage_ontology_term_id": [28, 34, 37, 42, 45, 47, 48, 49, 52], "development_stag": [28, 34, 37, 42, 45, 47, 48, 49, 52], "disease_ontology_term_id": [28, 34, 37, 42, 45, 47, 48, 49, 52], "observation_joinid": 28, "self_reported_ethnicity_ontology_term_id": [28, 34, 37, 42, 45, 47, 48, 49, 52], "sex_ontology_term_id": [28, 34, 37, 42, 45, 47, 48, 49, 52], "tissue_typ": 28, "text": [28, 29, 30, 31], "cell_census_build_d": 28, "cell_census_schema_vers": 28, "renam": [28, 37], "move": [28, 53], "varp": [28, 44], "dataset_presence_matrix": 28, "ascii": [28, 29], "0x22": 28, "exclam": 29, "intern": 29, "Its": 29, "notic": [29, 48], "april": 29, "printabl": 29, "charact": 29, "record": [29, 41], "machin": [29, 38], "parent": [29, 34], "longer": [29, 35], "dai": 29, "info_permalink": 29, "later": [29, 36, 38, 40, 42, 47], "release_alia": 29, "release_nam": 29, "null": 29, "url": [29, 38, 40], "blog": 30, "piec": [30, 34], "intend": [30, 51, 53], "deliv": 30, "hous": 30, "blurb": 30, "extern": 30, "goal": [30, 31, 34, 35, 39, 43], "master": 30, "link": [30, 37, 44, 45], "twitter": 30, "One": [30, 36], "stop": [30, 35, 46], "place": [30, 31, 35, 53], "histor": 30, "view": [30, 31, 37, 48, 51], "great": [30, 35, 39], "approach": [30, 36], "apach": 30, "subdirectori": 30, "markdown": [30, 31], "md": [30, 31], "prefix": 30, "yyyymmdd": 30, "discret": [30, 31, 35], "20230810": 30, "r_api_is_out": 30, "highest": [30, 31], "header": [30, 31], "concis": [30, 31], "explanatori": [30, 31], "white_check_mark": [30, 31], "cool": 30, "error": [30, 34, 38, 41], "ital": 30, "keyboard": 30, "john": 30, "smith": 30, "author1": 30, "phil": 30, "scoot": 30, "author2": 30, "introductori": [30, 31], "paragraph": [30, 31], "right": [30, 31, 37, 46], "underneath": [30, 31], "summari": [30, 31, 32], "30m": 30, "rest": [30, 31, 37], "render": [30, 31], "sidebar": [30, 31], "absenc": [30, 31], "sub": [30, 31, 48], "writer": [30, 31], "pgarcia": 30, "capabitli": 30, "part": [31, 35, 36], "cellcensu": 31, "symlink": 31, "asset": 31, "face": 31, "onboard": 31, "product": 31, "unless": 31, "direct": [31, 45], "mention": 31, "action": 31, "extract": [31, 43, 53], "length": [31, 32, 34, 37, 38], "exhaust": [31, 35], "showcas": [31, 34, 35, 43, 46, 47, 49], "clear": [31, 34, 36, 46], "power": 31, "bold": 31, "lower": [31, 37, 51, 53], "qc": 31, "much": [31, 36, 41], "equal": [31, 41, 42], "kept": 31, "succinct": 31, "liver": [31, 39, 46], "inspect": [31, 42, 47, 53], "prior": 31, "blob": [31, 48], "cellxgene_census_schema": 31, "repeat": [31, 46], "let": [31, 34, 35, 36, 37, 38, 39, 40, 42, 44, 45, 46, 47, 48, 49], "sc": [31, 35, 36, 37, 38, 39, 40, 48], "np": [31, 35, 36, 37, 38, 39, 40, 43, 44, 47], "tabula": [31, 35, 37, 39, 44, 45], "muri": [31, 35, 39, 45], "seni": [31, 35, 39, 45], "genom": [31, 48], "stream": [32, 56], "gget": 32, "collabor": [32, 36, 38], "predict": [32, 36], "biologi": [32, 47], "gain": 32, "natur": [32, 37, 38, 46, 48], "pipelin": 32, "summar": [32, 34, 37, 50], "leverag": 32, "cover": 34, "simpl": [34, 36, 40, 43, 48, 53], "sever": [34, 41, 42], "handl": [34, 41, 42, 46, 53], "34": [34, 35, 37, 38, 39, 40, 41, 43, 44, 45, 46, 48, 49, 50, 51, 52, 53], "39": [34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53], "think": [34, 40], "variou": [34, 36, 41, 50], "analog": 34, "census_info": [34, 35, 37, 39, 44, 45, 50], "census_obj": 34, "want": [34, 43, 46, 49, 53, 55], "pair": [34, 43], "61656118": [34, 41, 45], "37447773": 34, "13035": 34, "1417": 34, "Of": 34, "meta": [34, 46, 48], "consortia": 34, "idea": 34, "Not": 34, "cast": 34, "census_count": 34, "33364242": [34, 50], "56400873": [34, 45, 50], "264166": [34, 50], "279635": [34, 50], "25652": [34, 37, 50], "51304": [34, 50], "89477": [34, 50], "206754": [34, 50], "78750": [34, 50], "188248": [34, 50], "1357": [34, 50], "0002113": [34, 50], "179684": [34, 50], "208324": [34, 50], "kidnei": [34, 38, 44, 46, 50], "1358": [34, 50], "0002365": [34, 50], "15577": [34, 50], "31154": [34, 50], "exocrin": [34, 38, 47, 50], "1359": [34, 50], "0002367": [34, 50], "37715": [34, 50], "130135": [34, 50], "prostat": [34, 50], "1360": [34, 50], "0002368": [34, 50], "13322": [34, 50], "26644": [34, 50], "endocrin": [34, 38, 50], "1361": [34, 50], "0002371": [34, 50], "90225": [34, 50], "144962": [34, 50], "bone": [34, 38, 45, 46, 50], "marrow": [34, 45, 46, 50], "1362": [34, 50], "omit": 34, "creation": 34, "value_count": [34, 35, 37, 39, 41, 43, 46, 49], "sort": 34, "census_human_assai": 34, "sort_valu": [34, 38], "ascend": 34, "11845077": 34, "25597563": 34, "7559102": 34, "12638794": 34, "3872375": 34, "6139786": 34, "4062980": 34, "5064268": 34, "2930054": 34, "3139770": 34, "17": [34, 35, 37, 38, 39, 40, 42, 47, 48, 52], "915037": 34, "1084235": 34, "744798": 34, "811422": 34, "625175": 34, "642559": 34, "146278": 34, "177276": 34, "42397": 34, "121394": 34, "0010183": 34, "58981": [34, 37], "117962": 34, "96145": 34, "0008995": 34, "29128": 34, "4693": 34, "9386": 34, "3105": 34, "5244": 34, "69": [34, 38], "0000129": 34, "268114": 34, "370771": 34, "1038": [34, 35, 39, 44, 45], "48998": 34, "62617": 34, "easi": [34, 43, 47], "fall": [34, 35], "certain": [34, 36, 53], "distribut": [34, 35], "answer": 34, "exemplifi": 34, "stat": 34, "trivial": 34, "human_cell_typ": 34, "syncytiotrophoblast": [34, 49], "placent": [34, 49], "villou": [34, 49], "trophoblast": [34, 37, 38, 44, 45, 49], "extravil": [34, 49], "56400868": [34, 37], "pericyt": [34, 37, 38, 53], "56400869": [34, 37], "56400870": [34, 37], "56400871": [34, 37], "56400872": [34, 37], "focu": [34, 35, 36, 39], "de": 34, "shape": [34, 36, 37, 42, 43, 46, 47, 53], "human_cell_type_count": 34, "2673669": 34, "glutamaterg": [34, 38], "1541605": 34, "cd4": [34, 37, 38, 40], "alpha": [34, 37, 38], "1258976": 34, "cd8": [34, 37, 38, 40], "1235987": 34, "classic": [34, 37], "monocyt": [34, 37, 38, 40], "1030996": 34, "microfold": 34, "epithelium": 34, "intestin": [34, 38, 46], "dendrit": [34, 38, 40], "serou": 34, "bronchu": 34, "sperm": [34, 50], "enteroendocrin": 34, "599": 34, "abund": [34, 37], "That": 34, "achiev": [34, 47], "human_liver_cell_typ": 34, "85739": 34, "hepatoblast": 34, "58447": 34, "neoplast": [34, 38], "52431": 34, "erythroblast": 34, "45605": 34, "31388": 34, "pulmonari": [34, 37, 48, 49], "arteri": 34, "endotheli": [34, 37, 38, 44, 46, 53], "germin": 34, "center": 34, "b": [34, 37, 38, 40, 49], "pneumocyt": [34, 37], "innat": 34, "lymphoid": 34, "126": [34, 53], "go": 34, "sake": [34, 37, 43], "t_cells_list": 34, "t_cells_diseas": 34, "f": [34, 35, 36, 37, 38, 39, 40, 41, 44, 45, 46, 52, 53], "hodgkin": 34, "lymphoma": 34, "blood": [34, 44, 46, 48, 49], "62499": 34, "819428": 34, "30578": 34, "nose": 34, "respiratori": [34, 37, 50], "saliva": 34, "41": [34, 38], "crohn": 34, "colon": 34, "17490": 34, "52029": 34, "down": 34, "syndrom": 34, "181": 34, "breast": 34, "cancer": [34, 37], "1850": 34, "chronic": [34, 37, 49], "obstruct": [34, 37, 49], "9382": 34, "rhiniti": 34, "909": 34, "renal": [34, 37, 44, 45], "carcinoma": [34, 37, 49], "6548": 34, "20540": 34, "lymph": 34, "cystic": [34, 37], "fibrosi": [34, 37, 49], "follicular": 34, "1089": 34, "influenza": 34, "8871": 34, "interstiti": [34, 37, 38, 48, 49], "1803": 34, "benign": 34, "neoplasm": 34, "oncocytoma": 34, "2408": 34, "adenocarcinoma": [34, 37, 49], "205": 34, "3274": 34, "507": 34, "215013": 34, "24969": 34, "pleural": 34, "fluid": 34, "11558": 34, "5922": 34, "lymphangioleiomyomatosi": [34, 37, 49], "513": 34, "36573": 34, "nonpapillari": 34, "adipos": [34, 46], "4828": 34, "288": [34, 44], "clot": 34, "1717": 34, "69136": 34, "pleomorph": [34, 37, 49], "1715": 34, "pneumonia": [34, 37, 49], "856": [34, 43], "1671": 34, "disord": 34, "34301": 34, "squamou": [34, 37, 38, 49], "52053": 34, "lupu": 34, "erythematosu": 34, "355471": 34, "don": [34, 39, 41, 46, 49], "forget": [34, 39, 41, 49], "del": [34, 35, 36, 37], "studi": [35, 36], "opportun": 35, "inter": 35, "ignor": [35, 36, 37, 38, 39, 40, 42, 43, 47], "home": [35, 37, 39], "ssm": [35, 37, 39], "lib": [35, 37, 39], "python3": [35, 37, 39], "_set": 35, "63": [35, 38], "userwarn": [35, 37, 39], "70": [35, 38], "dl_pin_memory_gpu_train": 35, "pin_memori": 35, "loader": 35, "tqdm": [35, 37, 39], "auto": [35, 37, 39], "tqdmwarn": [35, 37, 39], "iprogress": [35, 37, 39], "jupyt": [35, 37, 39, 55], "ipywidget": [35, 37, 39], "user_instal": [35, 37, 39], "autonotebook": [35, 37, 39], "notebook_tqdm": [35, 37, 39], "census_dataset": [35, 37, 44, 45], "tabula_liv": 35, "loc": [35, 44], "525": [35, 39], "0b9d8a04": [35, 39, 45], "bb9d": [35, 39, 45], "44da": [35, 39, 45], "aa27": [35, 39, 45], "705bb65b54eb": [35, 39, 45], "s41586": [35, 39, 44, 45], "020": [35, 39, 44, 45], "2496": [35, 39, 45], "4546e757": [35, 39], "34d0": [35, 39], "4d17": [35, 39], "be06": [35, 39], "538318925fcd": [35, 39], "atla": [35, 37, 39, 44, 45, 46], "cha": [35, 39], "2859": [35, 39], "547": 35, "6202a243": [35, 46], "b713": [35, 46], "4e12": [35, 46], "9ced": [35, 46], "c387f8483dea": [35, 46], "7294": [35, 46], "tabula_muris_liver_id": 35, "smart_seq_gene_length": 35, "to_numpi": [35, 36, 37, 38, 39, 43, 47], "smart_seq_index": 35, "smart_seq_x": 35, "proce": [35, 39], "ceil": 35, "put": [35, 47], "omic": [35, 47], "primarili": [35, 36, 37], "yosef": 35, "lab": [35, 37, 44, 45, 47], "uc": [35, 36], "berkelei": 35, "variat": [35, 36], "infer": [35, 53], "deep": 35, "scrna": [35, 37], "comprehens": 35, "best": [35, 36], "practic": [35, 39], "strength": 35, "bread": [35, 37], "butter": [35, 37], "neighbor": [35, 36, 37, 38, 39, 40, 42, 47], "graph": [35, 36], "visual": [35, 36, 37, 38, 40], "umap": [35, 36, 37, 38, 39, 40, 42, 47], "But": [35, 46], "save": [35, 45, 47, 48, 53], "normalize_tot": [35, 36, 37, 38, 39, 40], "target_sum": [35, 36, 37, 38, 39, 40], "1e4": [35, 37, 38, 39, 40], "log1p": [35, 36, 37, 38, 39, 40], "max_valu": [35, 37, 38, 39], "final": [35, 36, 38, 39, 43, 44, 46, 47, 51, 53], "tl": [35, 36, 37, 38, 39, 40, 42, 47], "pca": [35, 37, 38, 39], "n_neighbor": [35, 36, 38, 40], "n_pc": [35, 38], "40": [35, 38], "pl": [35, 36, 37, 38, 39, 40, 42, 47, 48], "color": [35, 36, 37, 38, 39, 40, 42, 47], "plot": [35, 36, 37, 39, 40, 42, 47], "_tool": [35, 37, 39], "scatterplot": [35, 36, 37, 39], "392": [35, 37, 39], "No": [35, 37, 39], "colormap": [35, 37, 39], "cmap": [35, 37, 39], "cax": [35, 37, 39], "scatter": [35, 36, 37, 39, 40, 42, 47], "strong": [35, 37], "properli": 35, "principl": 35, "randomli": [35, 36], "whenev": 35, "evidenc": 35, "articl": 35, "health": 35, "sikkema": 35, "et": [35, 46], "al": [35, 46], "whom": 35, "perfom": 35, "43": [35, 38, 44, 51], "latent": [35, 36, 40], "setup_anndata": 35, "vae": 35, "n_layer": 35, "n_latent": 35, "gene_likelihood": 35, "nb": 35, "n_hidden": 35, "50": [35, 38, 49], "gpu": [35, 38, 40], "tpu": 35, "tf_cpp_min_log_level": 35, "rerun": [35, 36], "info": [35, 37, 40, 48], "max_epoch": 35, "ipu": 35, "hpu": 35, "epoch": [35, 53], "00": [35, 39, 42], "15it": 35, "v_num": 35, "train_loss_step": 35, "545": 35, "train_loss_epoch": 35, "560": 35, "trainer": [35, 38], "17it": 35, "represent": [35, 36, 38], "x_scvi": 35, "get_latent_represent": [35, 40], "use_rep": [35, 36, 38, 40, 42, 47], "mainli": 35, "driven": [35, 36], "albeit": 35, "contribut": [35, 36, 37, 42, 47], "curat": [35, 48], "strongli": 35, "22": [35, 37, 38, 48, 50, 52, 55], "dataset_id_donor_id": 35, "astyp": [35, 36, 38], "23": [35, 37, 38, 44, 48], "24": [35, 37, 38, 44, 52], "27it": 35, "520": 35, "550": 35, "25it": 35, "mostli": [35, 37], "nucleu": [35, 47, 49], "accomplish": [35, 37], "latter": [35, 49], "knowledg": 36, "journei": 36, "2d": [36, 42, 47], "involv": 36, "nonlinear": 36, "transform": [36, 37, 38, 39, 40, 47], "Such": 36, "affect": [36, 53], "manifold": 36, "overclust": 36, "typic": [36, 53], "reduct": [36, 46], "mind": [36, 50], "hypothes": 36, "focus": 36, "ultim": 36, "investig": 36, "behind": 36, "foundat": [36, 47], "emb": [36, 38, 42, 47], "technic": 36, "often": 36, "might": [36, 48], "pure": 36, "systemat": 36, "bias": [36, 37], "factor": 36, "complic": 36, "matter": 36, "techniqu": 36, "nearest": 36, "themselv": 36, "amplifi": [36, 38], "rigor": 36, "benchmark": 36, "fulli": 36, "space": [36, 38], "highlight": 36, "challeng": 36, "unsolv": 36, "problem": 36, "briefli": [36, 48], "illustr": [36, 47], "capac": 36, "captur": 36, "intrigu": 36, "phenomena": 36, "disclaim": 36, "depth": [36, 37, 39], "insight": [36, 47], "glean": 36, "innacur": 36, "leidenalg": 36, "hdbscan": 36, "scikit": [36, 55], "warn": [36, 37, 38, 40, 42, 47], "get_embed": [36, 38, 47], "get_embedding_metadata": [36, 47], "filterwarn": [36, 38, 40, 42, 47], "def": [36, 43, 53], "generate_umaps_from_embed": 36, "emb_nam": [36, 42], "euclidean": 36, "key_ad": 36, "neighbors_kei": 36, "x_emb_nam": 36, "x_": 36, "_": [36, 47], "_umap": 36, "x_umap": 36, "var_nam": [36, 37, 38, 40], "build_anndata_with_embed": 36, "embedding_uri": [36, 47], "embedding_nam": 36, "coord": [36, 47], "experiment_nam": [36, 47, 52], "miss": [36, 40, 43, 47], "nan": [36, 47, 51], "intersect": 36, "accordingli": 36, "filt": 36, "ones": 36, "nan_row_sum": 36, "isnan": [36, 43], "total_column": 36, "embedding_uris_commun": 36, "scgpt": [36, 47], "contrib": [36, 38, 40, 47], "cxg": [36, 47], "embedding_names_censu": 36, "embedding_names_al": 36, "obs_df": [36, 41, 43, 47, 50, 52], "n_subset_cel": 36, "150000": 36, "idx_rand": 36, "choic": [36, 38, 40, 48], "soma_joinids_subset": 36, "tolist": [36, 37, 40, 41], "799353": 36, "distinctli": 36, "oca2": 36, "marker": [36, 40], "kit": 36, "vari": 36, "immatur": 36, "clearli": 36, "slight": 36, "extens": [36, 46], "concentr": 36, "seen": 36, "satellit": 36, "signatur": 36, "probabl": [36, 38, 53], "mani": [36, 43, 53], "disconnect": 36, "compon": 36, "tend": 36, "extent": 36, "versu": 36, "unclear": 36, "qualit": 36, "pronounc": 36, "basi": 36, "geneformer_umap": 36, "use_raw": 36, "scgpt_umap": 36, "uce_umap": 36, "scvi_umap": 36, "subclust": 36, "leiden": [36, 38, 40], "emploi": 36, "densiti": 36, "pairwis": 36, "distanc": [36, 43], "compar": [36, 40], "reveal": [36, 37], "distinct": [36, 53], "signific": [36, 50], "agreement": 36, "mutual": 36, "nmi": 36, "score": 36, "assign": [36, 43], "65": [36, 38], "inher": 36, "expect": [36, 37, 39, 47], "finetun": 36, "subclass": 36, "homogen": [36, 53], "belong": 36, "underscor": 36, "draw": 36, "coupl": 36, "conclus": 36, "lead": 36, "identif": 36, "evid": 36, "examin": [36, 53], "relianc": 36, "unjustifi": 36, "known": 36, "phenomenon": 36, "cross": [36, 37], "fuller": 36, "hold": [36, 53], "necessit": 36, "thereof": 36, "pd": [36, 37, 40, 43, 51, 52, 53], "pdist": 36, "squareform": 36, "sklearn": [36, 40], "normalized_mutual_info_scor": 36, "adata_rbn": 36, "obsp": 36, "_connect": 36, "_leiden": 36, "pairwise_dist": 36, "_hdbscan": 36, "min_cluster_s": 36, "min_sampl": 36, "precomput": [36, 50], "fit_predict": 36, "displai": [36, 40, 41, 43, 47, 48, 53], "embedding_kei": 36, "sim_scores_leiden": 36, "len": [36, 37, 38, 40, 41, 43, 45, 46, 53], "sim_scores_hdbscan": 36, "embedding_i": 36, "enumer": 36, "embedding_j": 36, "sim_scores_leiden_t": 36, "sim_scores_hdbscan_t": 36, "seem": [36, 37], "log": [36, 37, 39, 40], "08115140648299893": 36, "7314893672395334": 36, "33702547333985217": 36, "7730928192948211": 36, "723355": 36, "721222": 36, "677754": 36, "775717": 36, "753719": 36, "822202": 36, "089308": 36, "106379": 36, "073141": 36, "480575": 36, "646415": 36, "356779": 36, "11896761": 36, "th": 36, "wherea": [36, 47], "tendenc": 36, "condit": [36, 49], "glioblastoma": 36, "pilocyt": 36, "astrocytoma": 36, "mix": 36, "outsid": 36, "53d208b0": [36, 37, 44], "2cfd": [36, 37, 44], "4366": [36, 37, 44], "9866": [36, 37, 44], "c3c6114081bc": [36, 37, 44], "smartseq": 36, "cftr": 36, "rare": 36, "recogniz": 36, "coo_matrix": 37, "summary_t": 37, "980": [37, 51], "2907156": 37, "6011592": 37, "lung_ob": 37, "5945423": 37, "9f222629": [37, 48], "9e39": [37, 48], "47d0": [37, 48], "b83f": [37, 48], "e08d610c7479": [37, 48], "nativ": [37, 50], "0000003": [37, 41, 50], "0000461": [37, 49, 52], "5945426": 37, "ciliat": [37, 38], "columnar": [37, 38], "tracheobronchi": 37, "tree": 37, "0002145": 37, "57": [37, 38], "hsapdv": [37, 49], "0000151": 37, "0002771": 37, "0000384": [37, 52], "5945428": 37, "0000625": [37, 41], "0005097": 37, "5945432": 37, "0000624": [37, 41], "0005061": 37, "5945441": 37, "2907151": 37, "8c42cfd0": [37, 44, 45, 48], "0b0a": [37, 44, 45, 48], "46d5": [37, 44, 45, 48], "910c": [37, 44, 45, 48], "fc833d83c45e": [37, 44, 45, 48], "0000669": [37, 41], "0000145": 37, "0000383": [37, 52], "2907152": 37, "2907153": 37, "2907154": 37, "2907155": 37, "deeper": 37, "dive": 37, "characterist": 37, "set_index": [37, 40, 43, 45, 51, 52], "f171db61": [37, 44, 45, 49], "e57": [37, 44, 45, 49], "4535": [37, 44, 45, 49], "a06a": [37, 44, 45, 49], "35d8b6ef8f2b": [37, 44, 45, 49], "developm": [37, 44, 45], "donor_p13_trophoblast": [37, 44, 45], "ecf2e08": [37, 44, 45], "2032": [37, 44, 45], "4a9e": [37, 44, 45], "b466": [37, 44, 45], "b65b395f4a02": [37, 44, 45], "74cff64f": [37, 44, 45], "9da9": [37, 44, 45], "4b2a": [37, 44, 45], "9b3b": [37, 44, 45], "8a04a1598040": [37, 44, 45], "vivo": [37, 44, 45], "5af90777": [37, 44, 45], "6760": [37, 44, 45], "4003": [37, 44, 45], "9dba": [37, 44, 45], "8f945fec6fdf": [37, 44, 45], "intr": [37, 44, 45], "bd65a70f": [37, 44, 45], "b274": [37, 44, 45], "4133": [37, 44, 45], "b9dd": [37, 44, 45], "0d1431b6af34": [37, 44, 45], "multiregion": [37, 44, 45], "imm": [37, 44, 45], "f9ad5649": [37, 44, 45], "f372": [37, 44, 45], "43e1": [37, 44, 45], "a3a8": [37, 44, 45], "423383e5a8a2": [37, 44, 45], "molecular": [37, 44, 45], "character": [37, 39, 44, 45, 46], "vuln": [37, 44, 45], "456e8b9b": [37, 44, 45], "f872": [37, 44, 45], "488b": [37, 44, 45], "871d": [37, 44, 45], "94534090a865": [37, 44, 45], "peripher": [37, 44, 45], "immun": [37, 44, 45, 46], "respon": [37, 44, 45], "589": [37, 44, 45], "2adb1f8a": [37, 44, 45, 49], "a6b1": [37, 44, 45, 49], "4909": [37, 44, 45, 49], "8ee8": [37, 44, 45, 49], "484814e2d4bf": [37, 44, 45, 49], "landscap": [37, 44, 45], "sing": [37, 44, 45], "590": [37, 44, 45], "e04daea4": [37, 44, 45], "4412": [37, 44, 45], "45b5": [37, 44, 45], "989e": [37, 44, 45], "76a9be070a89": [37, 44, 45], "krasnow": [37, 44, 45], "591": [37, 44, 45], "592": [37, 44, 45], "append": [37, 47], "dataset_cell_count": 37, "cell_count": 37, "merg": [37, 38, 47, 51], "1e6a6ef9": 37, "7ec9": 37, "4c90": 37, "bbfb": 37, "2ad3c3165fd1": 37, "1028006": 37, "resolut": [37, 48], "luca": 37, "ex": 37, "314": 37, "784630": 37, "f7c1c579": 37, "2dc0": 37, "47e2": 37, "ba19": 37, "8165c5a0e353": 37, "217738": 37, "fetal": 37, "survei": 37, "embryon": 37, "483": 37, "d8da613f": 37, "e681": 37, "4c69": 37, "b463": 37, "e94f5e66847f": 37, "116313": 37, "lethal": 37, "80": [37, 38, 50], "576f193c": 37, "75d0": 37, "4a11": 37, "bd25": 37, "8676587e6dc2": 37, "90384": 37, "htan": 37, "msk": 37, "377": 37, "d41f45c1": 37, "1b7b": 37, "4573": 37, "a998": 37, "ac5c5acb1647": 37, "82991": 37, "reg": 37, "regulatori": 37, "58": [37, 38], "3dc61ca1": 37, "ce40": 37, "46b6": 37, "8337": 37, "f27260fd9a03": 37, "71752": 37, "uncov": 37, "proxima": 37, "325": 37, "60993": 37, "2672b679": 37, "8048": 37, "4f5e": 37, "9786": 37, "f1b196ccfd08": 37, "57019": 37, "spleen": [37, 44, 46], "parenchyma": 37, "416": 37, "9dbab10c": 37, "118d": 37, "496b": 37, "966a": 37, "67f1763a6b7d": 37, "49014": 37, "criti": 37, "482": 37, "9968be68": 37, "ab65": 37, "4a38": 37, "9e1a": 37, "c9b6abece194": 37, "47909": 37, "chart": 37, "endod": 37, "78": [37, 38], "3de0ad6d": 37, "4378": 37, "4f62": 37, "b37b": 37, "ec0b75a50d94": 37, "46500": 37, "lungmap": 37, "broad": 37, "ag": [37, 39, 46], "healthi": 37, "456": 37, "2f132ec9": 37, "24b5": 37, "422f": 37, "9be0": 37, "ccef03b4fe28": 37, "39778": 37, "sar": 37, "cov": 37, "receptor": [37, 50], "ace2": [37, 48], "tmprss2": 37, "prima": 37, "312": 37, "1e5bd3b8": 37, "6a0e": 37, "4959": 37, "8d69": 37, "cafed30fe814": 37, "35699": 37, "emphysema": [37, 49], "130": 37, "35682": [37, 44], "475": [37, 44], "1b9d8702": 37, "5af8": 37, "4142": 37, "85ed": 37, "020eb06ec4f6": 37, "35419": 37, "tiss": 37, "411": 37, "4ed927e9": 37, "c099": 37, "49af": 37, "b8ce": 37, "a2652d069333": 37, "35284": 37, "367": 37, "33698": 37, "4b6af54a": 37, "4a21": 37, "46e0": 37, "bc8d": 37, "673c0561a836": 37, "18386": 37, "01209dce": 37, "3575": 37, "4bed": 37, "b1df": 37, "129f57fbc031": 37, "11059": 37, "8657": 37, "f9846bb4": 37, "784d": 37, "4582": 37, "92c1": 37, "3f279e4c6f0c": 37, "176": [37, 44], "fibroblast": [37, 38, 48, 50], "smooth": 37, "muscl": [37, 38, 44, 46], "317": 37, "f64e1be1": 37, "de15": 37, "4d27": 37, "8da4": 37, "82225cd4c035": 37, "55": [37, 38, 52], "370": 37, "810ac45f": 37, "8969": 37, "4698": 37, "b42c": 37, "652f802f75c2": 37, "endothelium": 37, "320": 37, "0ba16f4b": 37, "cb87": 37, "4fa3": 37, "9363": 37, "19fc51eec6e7": 37, "myeloid": [37, 38], "326": 37, "reprens": 37, "divers": [37, 41, 44, 47], "plastic": 37, "tumor": 37, "neutrophil": 37, "subpopul": 37, "distal": 37, "gradient": 37, "differenti": [37, 38], "regul": 37, "epitheli": [37, 38, 44, 46, 50, 53], "fate": 37, "tell": 37, "1236968": 37, "702074": 37, "262323": 37, "122902": 37, "97432": 37, "65220": 37, "41852": 37, "25662": 37, "8638": 37, "8016": 37, "1164084": 37, "772120": 37, "331019": 37, "209675": 37, "120796": 37, "55254": 37, "51343": 37, "45714": 37, "31923": 37, "31792": 37, "31540": 37, "21167": 37, "17590": 37, "12374": 37, "10765": 37, "doesn": 37, "1402565": 37, "1122990": 37, "381601": 37, "2468587": 37, "438569": 37, "head": [37, 44], "alveolar": [37, 50], "macrophag": [37, 38], "291507": 37, "263362": 37, "211456": 37, "189471": 37, "154415": 37, "ii": 37, "128463": 37, "tract": 37, "105090": 37, "102303": 37, "killer": [37, 38, 46, 48], "95953": 37, "92846": 37, "stromal": [37, 38, 44, 46], "87714": 37, "81125": 37, "malign": 37, "75917": 37, "plasma": 37, "64551": 37, "59353": 37, "45305": 37, "capillari": 37, "39416": 37, "36381": 37, "36049": 37, "35467": 37, "2576327": 37, "147410": 37, "alveolu": 37, "54085": 37, "lingula": 37, "upper": [37, 44], "lobe": 37, "32099": 37, "17854": 37, "12880": 37, "10113": 37, "9276": 37, "7981": 37, "middl": 37, "3847": 37, "lung_var": 37, "ensg00000121410": [37, 44], "a1bg": [37, 44], "3999": [37, 44], "ensg00000268895": [37, 44], "as1": [37, 44], "3374": [37, 44], "ensg00000148584": [37, 44], "a1cf": [37, 44], "9603": [37, 44], "ensg00000175899": [37, 44], "a2m": [37, 44], "6318": [37, 44], "ensg00000245105": [37, 44], "2948": [37, 44], "ensg00000288719": [37, 44], "rp4": [37, 44], "669p10": [37, 44], "ensg00000288720": [37, 44], "rp11": [37, 44], "852e15": [37, 44], "7007": [37, 44], "ensg00000288721": [37, 44], "rp5": [37, 44], "973n23": [37, 44], "7765": [37, 44], "ensg00000288723": [37, 44], "553n16": [37, 44], "1015": [37, 44], "ensg00000288724": [37, 44], "rp13": [37, 44], "546i2": [37, 44], "625": [37, 44], "60664": [37, 42, 44, 47, 53], "actual": [37, 53], "mislead": 37, "know": [37, 46, 49], "presence_matrix": [37, 39, 44], "get_presence_matrix": [37, 39, 44], "a1": 37, "17811": 37, "50259": 37, "44150": 37, "34265": 37, "22447": 37, "23642": 37, "26347": 37, "20921": 37, "24672": 37, "27705": 37, "27243": 37, "26323": 37, "27181": 37, "23203": 37, "57042": 37, "32610": 37, "29620": 37, "26454": 37, "23705": 37, "38676": 37, "47307": 37, "23740": 37, "22552": 37, "20594": 37, "19952": 37, "uint64": 37, "genes_measur": 37, "var_somaid": 37, "nonzero": [37, 39], "ensg00000128274": 37, "a4galt": 37, "3358": 37, "ensg00000094914": 37, "aaa": 37, "4727": 37, "ensg00000081760": 37, "aac": 37, "16039": 37, "29951": 37, "ensg00000177272": 37, "kcna3": 37, "2476": 37, "30157": 37, "ensg00000184709": 37, "lrrc26": 37, "1209": 37, "30185": 37, "ensg00000087250": 37, "mt3": 37, "1679": 37, "30202": 37, "ensg00000136352": 37, "nkx2": 37, "3165": 37, "30512": 37, "ensg00000231439": 37, "wasir2": 37, "1054": 37, "11595": 37, "composit": 37, "infect": 37, "12k": 37, "intens": 37, "exercis": 37, "exploratori": 37, "000": 37, "lung_cell_subsampled_n": 37, "100000": 37, "lung_cell_subsampled_id": 37, "random_st": 37, "lung_gene_id": 37, "lung_adata": 37, "highest_expr_gen": 37, "n_top": 37, "calculate_qc_metr": 37, "percent_top": 37, "inplac": [37, 40], "violin": [37, 40], "n_genes_by_count": 37, "groupbi": [37, 40, 48, 50], "rotat": 37, "90": 37, "total_count": 37, "outlier": 37, "exlcud": 37, "ll": [37, 39, 52], "extra": 37, "preprocess": 37, "_highly_variable_gen": 37, "_simpl": 37, "843": 37, "view_to_actu": 37, "28": [37, 38, 48, 53], "n_cell_typ": 37, "drop_dupl": [37, 49], "randint": 37, "rang": [37, 38, 40, 42, 47, 53], "06x": 37, "0xffffff": 37, "palett": 37, "legend_loc": 37, "hard": 37, "32": [37, 38, 53], "top_cell_typ": 37, "reset_index": [37, 43], "lung_adata_top_cell_typ": 37, "unix": [38, 40], "interfac": [38, 40, 42, 47, 48, 53], "mkdir": [38, 40], "p": [38, 40, 43, 51], "wget": [38, 40], "nv": [38, 40], "pbmc3k_filtered_gene_bc_matric": [38, 40], "tar": [38, 40], "gz": [38, 40], "cf": [38, 40], "10xgenom": [38, 40], "pbmc3k": [38, 40], "xzf": [38, 40], "09": [38, 47], "38": [38, 48, 51], "7621991": [38, 40], "gt": [38, 40, 42, 44, 48], "deatail": [38, 40], "insid": [38, 40], "geneformer_info": 38, "cxg_embedding_info": [38, 40], "model_link": [38, 40, 47], "cli": [38, 45], "fine_tuned_geneform": 38, "progress": [38, 48], "bertforsequenceclassif": 38, "datacollatorforcellclassif": 38, "transcriptometoken": 38, "embextractor": 38, "ml": [38, 53], "huggingfac": 38, "geneformertoken": 38, "ensembl": [38, 40, 48], "ensembl_id": [38, 40], "n_count": [38, 40], "joinid": [38, 40, 44, 47], "write": [38, 45], "disk": 38, "read_10x_mtx": [38, 40], "filtered_gene_bc_matric": [38, 40], "hg19": [38, 40], "gene_id": [38, 40], "h5ad_dir": 38, "makedir": 38, "track": 38, "token_dir": 38, "tokenized_data": 38, "custom_attr_name_dict": 38, "tokenize_data": 38, "data_directori": 38, "output_directori": 38, "output_prefix": 38, "file_format": 38, "filter_pass": 38, "model_dir": 38, "label_mapping_dict_fil": 38, "label_to_cell_subclass": 38, "fp": 38, "label_mapping_dict": 38, "best4": 38, "cn": 38, "sensu": 38, "vertebrata": 38, "gabaerg": 38, "abnorm": 38, "adventiti": [38, 48], "anim": 38, "cardiocyt": 38, "skelet": 38, "cuboid": 38, "contractil": 38, "defens": 38, "duct": 38, "ecto": 38, "ectoderm": 38, "endo": 38, "pancrea": [38, 44, 46], "urethra": 38, "eukaryot": 38, "fat": [38, 44], "germ": [38, 50], "glandular": 38, "35": [38, 53], "glial": 38, "37": 38, "hematopoiet": [38, 49], "precursor": 38, "hepatocyt": 38, "inflammatori": 38, "interneuron": [38, 44], "42": 38, "ionocyt": 38, "44": [38, 40, 48], "45": [38, 51], "46": 38, "leukocyt": [38, 53], "47": 38, "lymphocyt": 38, "48": [38, 43], "49": 38, "mammari": [38, 46], "mesenchym": [38, 48], "52": [38, 43], "meso": 38, "mesoderm": 38, "motor": 38, "mural": 38, "59": [38, 46], "myofibroblast": 38, "neural": 38, "termin": 38, "ovarian": 38, "surfac": 38, "67": [38, 51], "phagocyt": 38, "pigment": 38, "cultur": [38, 50], "71": 38, "primordi": 38, "progenitor": [38, 48], "73": 38, "salivari": 38, "sebac": 38, "75": [38, 44], "secretori": 38, "76": 38, "sensori": 38, "77": 38, "seromucu": 38, "secret": [38, 48], "somat": 38, "79": 38, "stem": [38, 48, 49, 52], "81": [38, 43], "82": 38, "83": [38, 43, 51], "84": 38, "transit": 38, "85": 38, "86": 38, "87": 38, "vertebr": 38, "load_from_disk": 38, "input_id": 38, "num_row": 38, "2700": 38, "dummi": [38, 40], "add_column": 38, "slow": 38, "pretrain": 38, "from_pretrain": 38, "data_col": 38, "vector": 38, "predicted_label_id": 38, "argmax": [38, 53], "predicted_label": 38, "predicted_cell_subclass": 38, "min_mean": 38, "0125": 38, "max_mean": 38, "min_disp": 38, "svd_solver": 38, "arpack": 38, "scapi": 38, "original_cell_typ": [38, 40], "cd14": [38, 40], "fcgr3a": [38, 40], "megakaryocyt": [38, 40], "rename_categori": 38, "titl": [38, 42, 47], "n_class": 38, "output_dir": 38, "geneformer_embed": 38, "embex": 38, "model_typ": 38, "cellclassifi": 38, "num_class": 38, "max_ncel": 38, "emb_label": 38, "emb_lay": 38, "forward_batch_s": 38, "nproc": 38, "extract_emb": 38, "model_directori": 38, "input_data_fil": 38, "re": [38, 42, 44], "grab": [38, 41, 44, 47, 51], "c697eaaf": [38, 40], "a3b": [38, 40], "4251": [38, 40], "b036": [38, 40], "5f9052179e70": [38, 40], "f2a488bf": [38, 40], "782f": [38, 40], "4c20": [38, 40], "a8e5": [38, 40], "cb34d48c1f7e": [38, 40], "fa8605cf": [38, 40], "f27e": [38, 40], "44af": [38, 40], "ac2a": [38, 40], "476bee4410d3": [38, 40], "3c75a463": [38, 40], "6a87": [38, 40], "4132": [38, 40], "83a8": [38, 40], "c3002624394d": [38, 40], "adata_censu": [38, 40], "simplifi": [38, 43], "shared_gen": 38, "index_subset": [38, 40], "3000": [38, 40], "adata_join": 38, "outer": 38, "liver_dataset": 39, "liver_dataset_id": 39, "liver_adata": 39, "859": 39, "52392": [39, 43, 45, 51], "gene_pres": 39, "17992": 39, "992": 39, "toarrai": [39, 42, 47], "000e": 39, "590e": 39, "02": [39, 42, 47], "969e": 39, "03": [39, 42, 44, 45], "280e": 39, "250e": 39, "400e": 39, "gene_length": 39, "00000000e": 39, "58654413e": 39, "32001885e": 39, "74444813e": 39, "31455088e": 39, "04": [39, 42, 47], "71500419e": 39, "78985747e": 39, "real": 39, "filter_cel": 39, "min_gen": 39, "filter_gen": 39, "min_cel": 39, "saniti": 39, "prepar": 40, "pbmc": 40, "3k": 40, "scvi_info": 40, "pt": 40, "functool": 40, "yaml": 40, "randomforestclassifi": 40, "unassign": 40, "model_filenam": 40, "prepare_query_anndata": 40, "is_train": 40, "trick": 40, "forward": [40, 53], "reprsent": 40, "vae_q": 40, "load_query_data": 40, "gene_symbol": [40, 48], "notnul": 40, "perfectli": 40, "appropri": 40, "markers_row1": 40, "il7r": 40, "lyz": 40, "ms4a1": 40, "cd8a": 40, "gnly": 40, "markers_row2": 40, "nkg7": 40, "ms4a7": 40, "fcer1a": 40, "cst3": 40, "ppbp": 40, "catch_warn": 40, "nk": 40, "label_map": 40, "adata_census_subset": 40, "adata_combin": 40, "correl": 40, "forest": 40, "classifi": 40, "rfc": 40, "predicted_cell_typ": [40, 53], "enough": [41, 43], "itself": 41, "tip": 41, "soma_df": 41, "faster": 41, "refin": 41, "_obs_": 41, "unique_cell_type_ontology_term_id": 41, "lot": 41, "top_10": 41, "nthe": 41, "0000525": [41, 49], "2000060": [41, 49], "0008036": [41, 49], "0002488": 41, "0002343": 41, "0000084": 41, "0001078": 41, "0000815": 41, "0000235": 41, "3000001": 41, "0000540": 41, "7665340": 41, "0000679": 41, "1894047": 41, "0000128": 41, "1881077": 41, "1508920": 41, "1477453": 41, "1419507": 41, "0000057": 41, "1397813": 41, "0000860": 41, "1369142": 41, "1308000": [41, 50], "4023040": 41, "1229658": 41, "occurr": 41, "lung_tissu": 41, "ntop": 41, "185": 41, "0002063": 41, "0000775": 41, "0001044": 41, "0001050": 41, "0000814": 41, "0000071": 41, "0000192": 41, "0002503": 41, "0002370": 41, "562038": 41, "0000583": 41, "526859": 41, "323985": 41, "323610": 41, "266333": 41, "255425": 41, "205013": 41, "0000623": 41, "164944": 41, "0001064": 41, "149067": 41, "0002632": 41, "132243": 41, "0002082": 41, "ooo2084": 41, "0002080": 41, "0000746": 41, "49929": 41, "0008034": 41, "33361": 41, "0002548": 41, "33180": 41, "0002131": 41, "30915": 41, "0000115": 41, "30054": 41, "18391": 41, "0000763": 41, "14408": 41, "13552": 41, "9690": 41, "0002144": 41, "9025": 41, "labl": 41, "cols_to_queri": 41, "complet": [41, 50], "df": [41, 48], "col": [41, 43, 44], "tuniqu": 41, "tongu": [42, 44, 46, 47, 53], "372": [42, 47], "axisarrai": [42, 47], "featu": [42, 47], "soma_data": [42, 43, 46, 47], "bfloat16": [42, 47], "bit": [42, 47], "expon": [42, 47], "mantissa": [42, 47], "simplest": [42, 47], "nervou": [42, 47], "manner": [42, 47, 53], "befor": [42, 47], "correspondong": [42, 47], "31780": [42, 47], "to_anndata": [42, 47], "mehtod": 42, "sparsendarrayread": 42, "turn": [42, 45], "emb_it": 42, "vstack": [42, 47], "31780x200": 42, "6356000": 42, "9672852e": 42, "2878418e": 42, "8632812e": 42, "5742188e": 42, "0664062e": 42, "3198853e": 42, "5390625e": 42, "9814453e": 42, "5078125e": 42, "6015625e": 42, "0000000e": 42, "6132812e": 42, "0070801e": 42, "9165039e": 42, "4296875e": 42, "9648438e": 42, "8828125e": 42, "1796875e": 42, "7109375e": 42, "3315430e": 42, "8125000e": 42, "6953125e": 42, "4218750e": 42, "4316406e": 42, "2756348e": 42, "1494141e": 42, "2187500e": 42, "4140625e": 42, "7890625e": 42, "1484375e": 42, "9663086e": 42, "2942505e": 42, "4531250e": 42, "6315918e": 42, "4765625e": 42, "2656250e": 42, "200": 42, "ependym": 42, "astrocyt": 42, "31775": 42, "oligodendrocyt": 42, "31776": 42, "31777": 42, "31778": 42, "31779": 42, "easier": 43, "experiment_queri": 43, "x_as_seri": 43, "nd": 43, "raw_n": 43, "iloc": 43, "expens": 43, "var_df": [43, 44, 51], "float64": 43, "coo": 43, "arrow_tbl": 43, "var_dim": 43, "by_var": 43, "errstat": 43, "raw_mean": 43, "ensmusg00000051951": [43, 51], "xkr4": [43, 51], "6094": [43, 51], "202": 43, "032743": 43, "ensmusg00000089699": [43, 51], "gm1992": [43, 51], "250": [43, 51], "ensmusg00000102343": [43, 51], "gm37381": [43, 51], "1364": [43, 51], "ensmusg00000025900": [43, 51], "rp1": [43, 51], "12311": [43, 51], "106": 43, "236265": 43, "ensmusg00000025902": [43, 51], "sox17": [43, 51], "4772": [43, 51], "3259": 43, "991975": 43, "52387": [43, 51], "ensmusg00000081591": [43, 51], "btf3": [43, 51], "ps9": [43, 51], "496": [43, 51], "52388": [43, 51], "ensmusg00000118710": [43, 51], "mmu": [43, 51], "mir": [43, 51], "467a": [43, 51], "3_ensmusg00000118710": [43, 51], "52389": [43, 51], "ensmusg00000119584": [43, 51], "rn18": [43, 51], "1849": [43, 51], "52390": [43, 51], "ensmusg00000118538": [43, 51], "gm18218": [43, 51], "970": [43, 51], "52391": [43, 51], "ensmusg00000084217": [43, 51], "setd9": [43, 51], "670": [43, 51], "welford": [43, 52], "npt": 43, "onlinematrixmeanvari": 43, "n_sampl": 43, "n_variabl": 43, "axix": 43, "n_a": 43, "int32": [43, 53], "u_a": 43, "m2_a": 43, "coord_vec": 43, "value_vec": 43, "_mean_variance_upd": 43, "m2": 43, "_mean_variance_fin": 43, "max": 43, "jit": 43, "nopython": 43, "col_arr": 43, "val_arr": 43, "squar": 43, "val": 43, "u_prev": 43, "m2_prev": 43, "accont": 43, "chan": 43, "adapt": [43, 47], "n_b": 43, "u_b": 43, "m2_b": 43, "mvn": 43, "raw_vari": 43, "848": 43, "312801": 43, "169": 43, "182975": 43, "279575": 43, "656207": 43, "malat1": 43, "ptprd": 43, "dlg2": 43, "pcdh9": 43, "n_cells_by_dataset": 43, "multiindex": 43, "from_product": 43, "n_cell": 43, "x_tbl": 43, "to_fram": 43, "get_index": 43, "pick": [43, 45], "3bbb6cf9": 43, "72b9": 43, "41be": 43, "b568": 43, "656de6eb18b5": 43, "ensmusg00000028399": 43, "79578": 43, "58b01044": 43, "c5e5": 43, "4b0f": 43, "8a2d": 43, "6ebf951e01ff": 43, "474": 43, "ensmusg00000052572": 43, "79513": 43, "98e5ea9f": [43, 52], "16d6": [43, 52], "47ec": [43, 52], "a529": [43, 52], "686e76515e39": [43, 52], "908": 43, "66ff82b4": 43, "9380": 43, "469c": 43, "bc4b": 43, "cfa08eacd325": 43, "c08f8441": 43, "4a10": 43, "4748": 43, "872a": 43, "e70c0bcccdba": 43, "ensmusg00000055421": 43, "79476": 43, "125": [43, 53], "3027": 43, "2910": 43, "117": 43, "ensmusg00000092341": 43, "79667": 43, "12622": 43, "20094": 43, "7102": 43, "12992": 43, "compil": 44, "n_dataset": 44, "therein": [44, 45], "human_rna": 44, "datasets_df": 44, "e2c257e7": [44, 45], "6f79": [44, 45], "487c": [44, 45], "b81c": [44, 45], "39451cd4ab3c": [44, 45], "023": [44, 45], "05869": [44, 45], "31497": [44, 45], "67070": [44, 45], "286326": [44, 45], "f7cecffa": [44, 45], "00b4": [44, 45], "4560": [44, 45], "a29a": [44, 45], "8ad626b8ee08": [44, 45], "1016": [44, 45], "ccell": [44, 45], "001": [44, 45], "270855": [44, 45], "3f50314f": [44, 45], "bdc9": [44, 45], "40c6": [44, 45], "8e4a": [44, 45], "b0901ebfbe4c": [44, 45], "2021": [44, 45], "007": [44, 45], "167283": [44, 45], "180bff9c": [44, 45], "c8a5": [44, 45], "4539": [44, 45], "b13b": [44, 45], "ddbc00d643e6": [44, 45], "s41593": [44, 45], "00764": [44, 45], "8168": [44, 45], "a72afd53": [44, 45], "ab92": [44, 45], "4511": [44, 45], "88da": [44, 45], "252fb0e26b9a": [44, 45], "s41591": [44, 45], "0944": [44, 45], "y": [44, 45], "44721": [44, 45], "38833785": [44, 45], "fac5": [44, 45], "48fd": [44, 45], "944a": [44, 45], "0f62a4c23ed1": [44, 45], "2157": [44, 45], "598266": [44, 45], "5d445965": [44, 45], "6f1a": [44, 45], "4b68": [44, 45], "ba3a": [44, 45], "b8f765155d3a": [44, 45], "2922": [44, 45], "9409": [44, 45], "65662": [44, 45], "593x60664": 44, "16133717": 44, "manipul": 44, "ensg00000286096": 44, "97a17473": 44, "e2b1": 44, "4f31": 44, "a544": 44, "44a60773e2dd": 44, "var_joinid": 44, "dataset_joinid": 44, "is_pres": 44, "tocoo": 44, "isin": 44, "e5f58829": 44, "1a66": 44, "40b5": 44, "a624": 44, "9046778e74f5": 44, "1126": 44, "abl4896": 44, "ff45e623": 44, "7f5f": 44, "46e3": 44, "b47d": 44, "56be0341f66b": 44, "13497": 44, "f01bdd17": 44, "4902": 44, "40f5": 44, "86e3": 44, "240d66dd2587": 44, "salivary_gland": 44, "27199": 44, "e6a11140": 44, "2545": 44, "46bc": 44, "929e": 44, "da243eed2ca": 44, "11505": 44, "e5c63d94": 44, "593c": 44, "4338": 44, "a489": 44, "e1048599e751": 44, "bladder": [44, 46], "24583": 44, "d8732da6": 44, "8d1d": 44, "42d9": 44, "b625": 44, "f2416c30054b": 44, "trachea": [44, 46], "9522": 44, "cee11228": 44, "9f0b": 44, "4e57": 44, "afe2": 44, "cfe15ee56312": 44, "34004": 44, "a357414d": 44, "2042": 44, "4eb5": 44, "95f0": 44, "c58604a18bdd": 44, "small_intestin": 44, "12467": 44, "a0754256": 44, "f44b": 44, "4c4a": 44, "962c": 44, "a552e47d3fdc": 44, "10650": 44, "983d5ec9": 44, "40e8": 44, "4512": 44, "9e65": 44, "a572a9c486cb": 44, "50115": 44, "5e5e7a2f": 44, "8f1c": 44, "42ac": 44, "90dc": 44, "b4f80f38e84c": 44, "20263": 44, "55cf0ea3": 44, "9d2b": 44, "4294": 44, "871e": 44, "bb4b49a79fc7": 44, "15020": [44, 53], "4f1555bc": 44, "4664": 44, "46c3": 44, "a606": 44, "78d34dd10d92": 44, "bone_marrow": [44, 45], "12297": 44, "2423ce2c": 44, "3149": 44, "4cca": 44, "a2ff": 44, "cf682ea29b5f": 44, "9641": 44, "1c9eb291": 44, "6d31": 44, "47e1": 44, "96b2": 44, "129b5e1ae64f": 44, "30746": 44, "18eb630b": 44, "a754": 44, "4111": 44, "8cd4": 44, "c24ec80aa5ec": 44, "lymph_nod": 44, "53275": 44, "0d2ee4ac": 44, "05ee": 44, "40b2": 44, "afb6": 44, "ebb584caa867": 44, "0ced5e76": 44, "6040": 44, "47ff": 44, "8a72": 44, "93847965afc0": 44, "thymu": [44, 46], "33664": 44, "283d65eb": 44, "dd53": 44, "496d": 44, "adb7": 44, "7570c7caa443": 44, "1101": [44, 47], "511898": 44, "8e10f1c4": 44, "8e98": 44, "41e5": 44, "b65f": 44, "8cd89a887122": 44, "2480956": 44, "139": 44, "fe1a73ab": 44, "a203": 44, "45fd": 44, "84e9": 44, "0f7fd19efcbd": 44, "dissect": 44, "amygdaloid": 44, "ami": [44, 55], "basolat": 44, "35285": 44, "143": 44, "f8dda921": 44, "5fb4": 44, "4c94": 44, "a654": 44, "c6fc346bfd6d": 44, "cerebr": 44, "cortex": 44, "cx": 44, "occipitotem": 44, "31899": 44, "160": 44, "dd03ce70": 44, "3243": 44, "4c96": 44, "9561": 44, "330cc461e4d7": 44, "perirhin": 44, "23732": 44, "165": 44, "d2b5efc1": 44, "14c6": 44, "4b5f": 44, "bd98": 44, "40f9084872d7": 44, "tail": 44, "hippocampu": 44, "hit": 44, "caudal": 44, "36886": 44, "175": 44, "c4b03352": 44, "af8d": 44, "492a": 44, "8d6b": 44, "40f304e0a122": 44, "superclust": 44, "medium": 44, "spini": 44, "152189": 44, "c2aad8fc": 44, "b63b": 44, "4f9b": 44, "9cfd": 44, "baf7bc9c1771": 44, "tempor": 44, "po": 44, "37642": 44, "177": 44, "c202b243": 44, "1aa1": 44, "4b16": 44, "bc9a": 44, "b36241f3b1e3": 44, "amygdala": 44, "excitatori": 44, "109452": 44, "178": 44, "bdb26abd": 44, "f4ba": 44, "4ea3": 44, "8862": 44, "c2340e7a4f55": 44, "cge": 44, "227671": 44, "183": 44, "acae7679": 44, "d077": 44, "461c": 44, "b857": 44, "ee6ccfeb267f": 44, "hih": 44, "ca1": 44, "39147": 44, "196": 44, "9372df2d": 44, "13d6": 44, "4fac": 44, "980b": 44, "919a5b7eb483": 44, "midbrain": 44, "periaqueduct": 44, "grai": 44, "33794": 44, "197": 44, "93131426": 44, "0124": 44, "4ab4": 44, "a013": 44, "9dfbcd99d467": 44, "epithalamu": 44, "eth": 44, "24327": 44, "206": [44, 51], "7c1c3d47": 44, "3166": 44, "43e5": 44, "9a95": 44, "65ceb2d45f78": 44, "pon": 44, "pn": 44, "pontin": 44, "reticular": 44, "49512": 44, "208": 44, "7a0a8891": 44, "9a22": 44, "4549": 44, "a55b": 44, "c2aca23c3a2a": 44, "hippocamp": 44, "74979": 44, "5e5ab909": 44, "f73f": 44, "4b57": 44, "98a0": 44, "6d2c5662f6a4": 44, "inferior": 44, "colliculu": 44, "32306": 44, "3f56901c": 44, "dd4a": 44, "47d6": 44, "b60b": 44, "7b0c0111cfb2": 44, "37911": 44, "3a7f3ab4": 44, "a280": 44, "4b3b": 44, "b2c0": 44, "6dd05614a78c": 44, "splatter": 44, "291833": 44, "249": 44, "35c8a04c": 44, "8639": 44, "4d15": 44, "8228": 44, "765d8d93fc96": 44, "hypothalamu": 44, "hth": 44, "supraopt": 44, "16753": 44, "270": 44, "07b1d7c8": 44, "5c2e": 44, "42f7": 44, "9246": 44, "26f746cd6013": 44, "myelencephalon": 44, "medulla": 44, "oblongata": 44, "27210": 44, "273": 44, "0325478a": 44, "9b52": 44, "b40a": 44, "2e2ab0d72eb1": 44, "intratelencephal": 44, "455006": 44, "483152": 44, "476": 44, "a68b64d8": 44, "aee3": 44, "4947": 44, "81b7": 44, "36b8fe5a44d2": 44, "82478": 44, "477": 44, "c5d88abe": 44, "f23a": 44, "45fa": 44, "a534": 44, "788985e93dad": 44, "264824": 44, "478": 44, "5a11f879": 44, "d1ef": 44, "458a": 44, "9b0bdfca5ebf": 44, "31691": 44, "479": 44, "104148": 44, "17481d16": 44, "ee44": 44, "49e5": 44, "bcf0": 44, "28c0780d8c4a": 44, "58109": 44, "ensg00000277745": 44, "h2ab3": 44, "58354": 44, "ensg00000233522": 44, "fam224a": 44, "2031": 44, "58411": 44, "ensg00000183146": 44, "prori": 44, "878": 44, "58523": 44, "ensg00000279274": 44, "533e23": 44, "58632": 44, "ensg00000277836": 44, "27211": 44, "all_experi": 45, "organism_nam": 45, "organism_experi": 45, "experiments_total_cel": 45, "num_cel": 45, "nfound": 45, "5255245": 45, "toolchain": 45, "0bd1a1d": 45, "3aee": 45, "40e0": 45, "b2ec": 45, "86c7a30c7149": 45, "522": 45, "atl": 45, "40220": [45, 46], "submitt": 45, "tabula_muris_seni": 45, "cp": 45, "lineag": [46, 47], "jin": 46, "tabula_muris_dataset_id": 46, "48b37086": [46, 48, 52], "25f7": [46, 48, 52], "4ecd": [46, 48, 52], "be66": [46, 48, 52], "f5bb378e3aea": [46, 48, 52], "tabula_muris_ob": 46, "35718": 46, "limb": 46, "28867": 46, "24540": 46, "21647": 46, "20680": 46, "12295": 46, "9275": 46, "lumen": 46, "8945": 46, "8613": 46, "7976": 46, "6777": 46, "6201": 46, "skin": [46, 52], "bodi": [46, 52], "4454": 46, "1887": 46, "tabula_muris_liver_dataset_id": 46, "tabula_muris_liver_ob": 46, "awar": 46, "chanc": 46, "priori": [46, 49], "sai": 46, "nk_cell": 46, "80935": 46, "nk_cells_primari": 46, "59109": 46, "aqp5": [46, 49], "adata_primari": 46, "demo": [46, 50], "awai": 46, "break": 46, "8448858": 46, "52812487": 46, "52812553": 46, "52812556": 46, "52812566": 46, "113": 46, "170": 46, "37033": 46, "37052": 46, "36904": 46, "36919": 46, "meaning": 47, "confirm": 47, "easiest": [47, 49], "embd": 47, "impli": 47, "anoth": 47, "sp": 47, "embbed": 47, "obs_joinid": 47, "embeddinng": 47, "stand": 47, "alon": 47, "00506592": 47, "01348877": 47, "03173828": 47, "02331543": 47, "02404785": 47, "02441406": 47, "00595093": 47, "0065918": 47, "00070572": 47, "00187683": 47, "04663086": 47, "04614258": 47, "115722": 47, "512": [47, 51], "advanc": [47, 51], "portion": 47, "caution": 47, "quit": 47, "500_000": 47, "fail": [47, 51], "embedding_slic": 47, "emb_data": 47, "emb_joinid": 47, "reindex_disable_on_axi": 47, "embedding_presence_mask": 47, "getnnz": 47, "embedding_data": 47, "embedding_joinid": 47, "00762939": 47, "00076675": 47, "00047874": 47, "03588867": 47, "00405884": 47, "00239563": 47, "00982666": 47, "00946045": 47, "00473022": 47, "0135498": 47, "01049805": 47, "03051758": 47, "critic": 47, "meaningless": 47, "embedding_metadata": 47, "toward": 47, "ai": 47, "burgeon": 47, "pioneer": 47, "million": 47, "distil": 47, "concern": 47, "transfer": 47, "optim": [47, 53], "superior": 47, "primary_contact": 47, "bo": 47, "wang": 47, "bowang": 47, "vectorinstitut": 47, "affili": 47, "toronto": 47, "additional_contact": 47, "doi": 47, "538439": 47, "additional_inform": 47, "data_typ": 47, "obs_embed": 47, "n_embed": 47, "62998417": 47, "n_featur": 47, "submission_d": 47, "nonsens": 47, "assert": 47, "laura": 48, "luebbert": 48, "lauraluebbert": 48, "caltech": 48, "edu": 48, "databas": 48, "facilit": [48, 54], "cite": 48, "googl": 48, "colab": 48, "q": 48, "setup": 48, "fri": 48, "jul": 48, "succesfulli": 48, "gget_cellxgen": 48, "speci": 48, "meta_onli": 48, "verbos": 48, "arg": 48, "slc5a1": 48, "ensg00000130234": 48, "ensg00000100170": 48, "ui": 48, "celltyp": 48, "mucu": 48, "neuroendocrin": 48, "canon": 48, "cellular": 48, "reus": 48, "secondari": 48, "portal": 48, "9b94ccb0a2e0a8f6182b213aa4852c491f6f6aff": 48, "backend": 48, "wmg": 48, "tissue_mapp": 48, "abca1": 48, "minut": 48, "3679": 48, "thousand": 48, "ensg00000165029": 48, "11343": 48, "5332": 48, "9739": 48, "24539": 48, "5081": 48, "3674": 48, "3675": 48, "3676": 48, "3677": 48, "3678": 48, "retina": 48, "config": 48, "inlinebackend": 48, "figure_format": 48, "dotplot": 48, "categor": 48, "ensmusg00000015405": 48, "047d57f2": 48, "4d14": 48, "45de": 48, "aa98": 48, "336c6f583750": 48, "97547": 48, "97548": 48, "97549": 48, "97550": 48, "97551": 48, "97552": 48, "example_adata": 48, "example_meta": 48, "querycondit": 49, "2313": 49, "2308": 49, "2309": 49, "2310": 49, "2311": 49, "2312": 49, "8626": 49, "1884": 49, "27047": 49, "tubb4b": 49, "2037": 49, "materi": 49, "shortli": 49, "comparison": 49, "op": 49, "sex_cell_metadata": 49, "669": 49, "385437": 49, "metatadata": 49, "cell_metadata_all_unknown_sex": 49, "9th": 49, "post": 49, "fertil": 49, "0000046": 49, "decidua": 49, "basali": 49, "0000453": 49, "placenta": 49, "0001987": 49, "3251329": 49, "56274573": 49, "cord": 49, "2000095": 49, "newborn": 49, "0000082": 49, "han": 49, "chines": 49, "0027": 49, "umbil": 49, "0012168": 49, "0000178": 49, "3251330": 49, "56274574": 49, "3251331": 49, "56274575": 49, "3251332": 49, "56274576": 49, "3251333": 49, "56274577": 49, "3251334": 49, "cell_metadata_b_cel": 49, "42720": 49, "10631": 49, "8742": 49, "8187": 49, "2083": 49, "1534": 49, "1512": 49, "1474": 49, "1210": 49, "332": 49, "204": 49, "133": 49, "gene_metadata": 49, "isn": 50, "narrow": 50, "as_index": 50, "0000001": 50, "0000006": 50, "2502": 50, "0000015": 50, "621": 50, "0000019": 50, "608": 50, "4028006": 50, "38250": 50, "609": 50, "4030009": 50, "tubul": 50, "segment": 50, "777": 50, "610": 50, "4030011": 50, "989": 50, "611": 50, "4030018": 50, "princip": 50, "107": [50, 51], "612": 50, "4030023": 50, "hillock": 50, "10170": 50, "semant": 51, "maxmimum": 51, "nois": 51, "disabl": 51, "docstr": 51, "hvgs_df": 51, "highly_variable_rank": 51, "230445": 51, "116": 51, "044863": 51, "749637": 51, "287551": 51, "276809": 51, "461324": 51, "407450": 51, "363945": 51, "055626": 51, "280": 51, "958509": 51, "combined_df": [51, 52], "188": 51, "ensmusg00000026117": 51, "zap70": 51, "2992": 51, "409091": 51, "14793": 51, "026717": 51, "350": 51, "775560": 51, "233": 51, "ensmusg00000026073": 51, "il1r2": 51, "1908": 51, "764085": 51, "41918": 51, "471500": 51, "402176": 51, "ensmusg00000026185": 51, "igfbp5": 51, "6006": 51, "234876": 51, "314355": 51, "591239": 51, "156": 51, "825651": 51, "ensmusg00000026180": 51, "cxcr2": 51, "3048": 51, "379390": 51, "10491": 51, "033344": 51, "640129": 51, "30296": 51, "ensmusg00000024803": 51, "ankrd1": 51, "2886": 51, "548572": 51, "274005": 51, "455137": 51, "741864": 51, "30313": 51, "ensmusg00000024987": 51, "cyp26a1": 51, "1983": 51, "186686": 51, "12973": 51, "622003": 51, "454": 51, "580162": 51, "30379": 51, "ensmusg00000018822": 51, "sfrp5": 51, "1900": 51, "927853": 51, "10943": 51, "645525": 51, "410": 51, "637004": 51, "32042": 51, "ensmusg00000031838": 51, "ifi30": 51, "91": 51, "676950": 51, "995276": 51, "564962": 51, "205886": 51, "33314": 51, "ensmusg00000092572": 51, "serpinb10": 51, "3490": 51, "264085": 51, "239812": 51, "487": 51, "535469": 51, "who": 51, "own": 51, "mv_df": 52, "3095357": 52, "915025": 52, "69571": 52, "774917": 52, "3095359": 52, "972801": 52, "9471": 52, "427044": 52, "3095363": 52, "169472": 52, "139042": 52, "208628": 52, "3095366": 52, "049836": 52, "24762": 52, "926397": 52, "3095368": 52, "345415": 52, "150412": 52, "440839": 52, "3278898": 52, "164319": 52, "339741": 52, "3278899": 52, "368339": 52, "930156": 52, "3278900": 52, "246049": 52, "886186": 52, "3278901": 52, "240724": 52, "307266": 52, "3278902": 52, "278420": 52, "086994": 52, "9314": 52, "keratinocyt": [52, 53], "0002337": 52, "mmusdv": 52, "0000089": 52, "18_53_m": 52, "0002097": 52, "18_47_f": 52, "basal": [52, 53], "epidermi": 52, "0002187": 52, "0000091": 52, "epiderm": 52, "0000362": 52, "logist": 53, "regress": 53, "primer": 53, "census_ml": 53, "experiment_datapip": 53, "10_000": 53, "mechan": 53, "encapsul": 53, "caller": 53, "importantli": 53, "lazili": 53, "avoid": 53, "legaci": 53, "interchang": 53, "torchdata": 53, "shuffler": 53, "strategi": 53, "held": 53, "1gb": 53, "caus": 53, "valid": 53, "randomsplitt": 53, "train_datapip": 53, "test_datapip": 53, "random_split": 53, "weight": 53, "experiment_dataload": 53, "enforc": 53, "nn": 53, "linear": 53, "logisticregress": 53, "input_dim": 53, "output_dim": 53, "super": 53, "sigmoid": 53, "train_epoch": 53, "train_dataload": 53, "loss_fn": 53, "devic": 53, "train_loss": 53, "train_correct": 53, "train_tot": 53, "zero_grad": 53, "softmax": 53, "loss": 53, "propag": 53, "backward": 53, "train_accuraci": 53, "secondli": 53, "42496620": 53, "42496621": 53, "42496622": 53, "42496633": 53, "42496634": 53, "42496635": 53, "desir": 53, "cuda": 53, "is_avail": 53, "cell_type_encod": 53, "classes_": 53, "crossentropyloss": 53, "adam": 53, "lr": 53, "7f": 53, "accuraci": 53, "4f": 53, "0167253": 53, "4856": 53, "0156710": 53, "4943": 53, "0149408": 53, "4813": 53, "0144469": 53, "5040": 53, "0141749": 53, "5669": 53, "0139776": 53, "6672": 53, "0138565": 53, "7920": 53, "0138094": 53, "8088": 53, "0136689": 53, "8757": 53, "0136101": 53, "8923": 53, "invok": 53, "eval": 53, "recov": 53, "At": 53, "pickl": 53, "unpickl": 53, "vein": 53, "123": 53, "124": 53, "127": 53, "helper": 54, "vscode": 55, "m6i": 55, "8xlarg": 55, "mount": 55, "nvme": 55, "drive": 55, "swap": 55, "third": 55, "parti": 55, "misc": 55, "soma_typ": 55, "clone": 55, "absent": 56, "paralleliz": 56}, "objects": {"": [[54, 0, 0, "-", "cellxgene_census"]], "cellxgene_census": [[1, 1, 1, "", "download_source_h5ad"], [9, 1, 1, "", "get_anndata"], [10, 1, 1, "", "get_census_version_description"], [11, 1, 1, "", "get_census_version_directory"], [12, 1, 1, "", "get_default_soma_context"], [13, 1, 1, "", "get_presence_matrix"], [14, 1, 1, "", "get_source_h5ad_uri"], [15, 1, 1, "", "open_soma"]], "cellxgene_census.experimental.ml.pytorch": [[2, 2, 1, "", "ExperimentDataPipe"], [3, 2, 1, "", "Stats"], [4, 1, 1, "", "experiment_dataloader"]], "cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe": [[2, 3, 1, "", "__init__"]], "cellxgene_census.experimental.ml.pytorch.Stats": [[3, 3, 1, "", "__init__"]], "cellxgene_census.experimental.pp": [[5, 1, 1, "", "get_highly_variable_genes"], [6, 1, 1, "", "highly_variable_genes"], [7, 1, 1, "", "mean_variance"]], "cellxgene_census.experimental.util": [[8, 1, 1, "", "X_sparse_iter"]]}, "objtypes": {"0": "py:module", "1": "py:function", "2": "py:class", "3": "py:method"}, "objnames": {"0": ["py", "module", "Python module"], "1": ["py", "function", "Python function"], "2": ["py", "class", "Python class"], "3": ["py", "method", "Python method"]}, "titleterms": {"api": [0, 20, 21, 31, 51, 52, 54], "document": 0, "cellxgene_censu": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 21, 42, 47], "download_source_h5ad": 1, "experiment": [2, 3, 4, 5, 6, 7, 8, 51, 54], "ml": [2, 3, 4], "pytorch": [2, 3, 4, 53], "experimentdatapip": [2, 53], "stat": [3, 19, 41], "experiment_dataload": 4, "pp": [5, 6, 7], "get_highly_variable_gen": [5, 51], "highly_variable_gen": [6, 51], "mean_vari": 7, "util": [8, 19, 54], "x_sparse_it": 8, "get_anndata": [9, 42, 47], "get_census_version_descript": 10, "get_census_version_directori": 11, "get_default_soma_context": 12, "get_presence_matrix": 13, "get_source_h5ad_uri": 14, "open_soma": 15, "what": [16, 21, 22, 30, 56], "": [16, 30, 48], "new": [16, 19, 21, 30, 32], "2023": [16, 22], "r": [17, 20, 23, 25], "packag": [17, 38], "cellxgen": [17, 20, 24, 27, 28, 29, 33, 34, 42, 47, 48], "censu": [17, 19, 20, 21, 22, 24, 26, 27, 28, 29, 30, 31, 32, 33, 34, 36, 37, 38, 39, 41, 44, 45, 46, 47, 49, 52, 53, 54], "v1": 17, "i": [17, 21, 22, 56], "out": [17, 46, 52], "instal": [17, 21, 23, 25, 48, 55], "usag": 17, "made": 17, "possibl": 17, "tiledbsoma": 17, "effici": [17, 18, 25], "access": [17, 19, 20, 42, 47], "singl": [17, 18, 19, 21, 26, 37, 38, 45, 49], "cell": [17, 18, 19, 22, 25, 26, 28, 34, 36, 37, 38, 40, 41, 42, 43, 44, 46, 47, 48, 49, 50, 54], "data": [17, 19, 20, 21, 22, 24, 26, 28, 29, 32, 33, 34, 35, 37, 38, 39, 40, 45, 46, 47, 48, 49, 54], "33m": 17, "from": [17, 21, 35, 36, 37, 38, 45, 48], "easi": 17, "us": [17, 18, 19, 21, 24, 32, 33, 38, 40, 43, 48], "handl": 17, "cloud": 17, "host": [17, 21, 47], "queri": [17, 19, 21, 25, 42, 47, 48, 49], "read": [17, 46], "metadata": [17, 19, 22, 25, 28, 34, 37, 41, 47, 48, 49], "export": [17, 19, 32], "slice": [17, 25, 35, 52, 54], "seurat": [17, 25], "singlecellexperi": [17, 25], "stream": 17, "increment": [17, 43, 52], "chunk": 17, "memori": [18, 25], "implement": 18, "commonli": 18, "method": 18, "calcul": [18, 19, 37, 43, 50, 52], "averag": 18, "varianc": [18, 43, 52], "gene": [18, 19, 34, 35, 37, 39, 41, 43, 44, 48, 49, 51], "express": [18, 37, 39, 45, 48, 49], "across": 18, "million": 18, "how": [18, 19, 20, 21], "work": 18, "exampl": [18, 30, 31, 34, 38, 39, 40, 41, 46, 52], "kra": 18, "aqp4": 18, "lung": [18, 36, 37], "epitheli": 18, "highli": [18, 51], "variabl": [18, 51], "find": [18, 35], "all": [18, 34, 37, 41, 44], "human": [18, 21, 34, 37], "esophagu": 18, "introduc": 19, "normal": [19, 21, 28, 35, 37, 39], "layer": [19, 21, 37], "pre": [19, 50], "statist": 19, "descript": 19, "ad": 19, "librari": 19, "size": 19, "enhanc": 19, "featur": [19, 21, 28, 54], "exist": 19, "toolkit": 19, "via": [19, 42, 47], "tiledb": [19, 20], "soma": [19, 20, 26, 56], "ob": [19, 28, 46, 48, 49], "var": [19, 28, 49], "help": 19, "u": 19, "improv": 19, "addit": 19, "cz": [20, 24, 28, 29, 33, 34, 48], "discov": [20, 24, 28, 29, 33, 48], "aw": 20, "avail": [20, 34], "specif": [20, 44], "releas": [20, 22, 24, 29, 33], "version": [20, 22, 28, 54, 55], "cli": 20, "programat": 20, "download": [20, 38, 40, 45], "python": [20, 21, 23, 25, 32, 54, 55], "faq": 21, "why": [21, 46], "should": 21, "contain": 21, "do": 21, "cite": [21, 24, 33], "public": 21, "doe": 21, "have": 21, "embed": [21, 32, 36, 37, 38, 42, 47], "differenti": 21, "other": [21, 38], "tool": [21, 24, 33, 35], "can": 21, "mous": [21, 35], "where": 21, "ar": [21, 46], "retriev": [21, 54], "origin": [21, 45], "h5ad": [21, 45], "dataset": [21, 28, 35, 37, 38, 44, 45, 53], "which": 21, "wa": 21, "built": 21, "increas": 21, "perform": [21, 38], "my": 21, "conda": 21, "ask": 21, "support": [21, 22], "contribut": 21, "get": [21, 54], "an": [21, 42, 46, 47, 48, 53], "arrayschema": 21, "error": 21, "when": [21, 46], "open": [21, 34, 39, 41, 44, 49, 53, 54], "run": 21, "import": [21, 36, 38], "databrick": 21, "long": 22, "term": 22, "lt": 22, "weekli": 22, "latest": [22, 55], "list": 22, "12": 22, "15": 22, "inform": [22, 28, 29], "donor": 22, "count": [22, 28, 34, 43, 50], "embbed": 22, "07": 22, "25": 22, "05": 22, "errata": 22, "duplic": [22, 46], "observ": [22, 36], "is_primary_data": [22, 31], "true": 22, "requir": [23, 36, 38, 40], "capabl": [24, 33], "schema": [24, 26, 28, 33], "question": [24, 33], "feedback": [24, 33], "issu": [24, 33], "come": [24, 33], "soon": [24, 33], "project": [24, 33, 38, 40], "quick": [25, 42, 47], "start": [25, 42, 47], "obtain": 25, "anndata": [25, 42, 46, 47, 48, 54], "object": [25, 26, 48], "summari": [26, 28, 34, 37, 50], "info": [26, 34], "census_info": [26, 28], "census_data": [26, 28], "includ": [26, 28, 34], "mirror": 27, "overview": 28, "definit": [28, 29, 36], "speci": 28, "multi": [28, 35], "constraint": 28, "assai": [28, 34, 37], "matrix": [28, 44, 54], "type": [28, 34, 37, 40, 41, 48], "sampl": [28, 36], "repeat": 28, "encod": 28, "organ": [28, 34], "census_obj": 28, "somacollect": 28, "somadatafram": 28, "tabl": [28, 31, 34, 45], "summary_cell_count": 28, "somaexperi": 28, "raw": 28, "m": 28, "rna": 28, "x": [28, 43], "somasparsendarrai": 28, "presenc": [28, 44, 54], "feature_dataset_presence_matrix": 28, "changelog": 28, "1": 28, "3": 28, "0": 28, "2": 28, "storag": [29, 42, 47], "polici": 29, "json": 29, "articl": 30, "editori": [30, 31], "guidelin": [30, 31], "locat": 30, "titl": [30, 31], "date": 30, "author": 30, "introduct": [30, 31], "section": [30, 31], "notebook": 31, "vignett": 31, "content": [31, 34, 47], "knowledg": 31, "reinforc": 31, "tutori": 32, "integr": [32, 35], "model": [32, 38, 40, 53], "uderstand": 32, "analyz": 32, "scalabl": 32, "comput": [32, 43], "machin": [32, 54], "learn": [32, 34, 37, 54], "about": [34, 37], "main": 34, "compon": 34, "each": [34, 44], "sequenc": [34, 39], "number": 34, "microgli": 34, "understand": [34, 46], "beyond": [34, 50], "liver": [34, 35], "diseas": [34, 37], "t": 34, "tissu": [34, 36, 37, 48], "fetch": [35, 36, 37, 39, 44, 45, 47, 48, 49, 50], "10x": [35, 38], "genom": 35, "smart": [35, 39], "seq2": 35, "length": [35, 39], "scvi": [35, 40, 42], "inspect": [35, 38], "prior": 35, "batch": 35, "defin": [35, 53], "dataset_id": [35, 43], "donor_id": 35, "assay_ontology_term_id": 35, "suspension_typ": 35, "explor": [36, 37, 39, 45, 50], "biolog": 36, "relev": 36, "cluster": [36, 39], "background": [36, 47], "function": 36, "melanocyt": 36, "ey": 36, "150k": 36, "retin": 36, "bipolar": 36, "neuron": 36, "dopaminerg": 36, "brain": 36, "pulmonari": 36, "ionocyt": 36, "tabula": [36, 46], "sapien": 36, "sex": 37, "v": 37, "nucleu": 37, "sub": 37, "qc": 37, "metric": 37, "creat": [37, 46, 50, 53], "geneform": [38, 42], "class": [38, 53], "predict": [38, 40, 53], "system": [38, 40], "fine": 38, "tune": 38, "prepar": 38, "subclass": 38, "infer": [38, 40], "load": [38, 42, 47], "token": 38, "result": 38, "gener": 38, "pbmc": 38, "3k": 38, "join": 38, "full": [39, 41], "seq": 39, "account": 39, "valid": 39, "through": 39, "train": [40, 53], "pretrain": 40, "summar": 41, "subset": 41, "select": [41, 48], "value_filt": 41, "collabor": 42, "format": [42, 47], "associ": [42, 47], "obsm": [42, 47], "slot": [42, 47], "experimentaxisqueri": [42, 47], "scipi": 42, "matric": 42, "numpi": [42, 47], "arrai": [42, 47], "onlin": 43, "algorithm": 43, "mean": [43, 52], "per": 43, "group": 43, "measur": 44, "id": 44, "identifi": 44, "sourc": 45, "file": 45, "filter": 46, "muri": 46, "seni": 46, "frame": 46, "core": [46, 52], "oper": 46, "dens": 47, "gget": 48, "modul": 48, "set": [48, 55], "up": [48, 55], "plot": 48, "dot": 48, "similar": 48, "those": 48, "shown": 48, "onli": 48, "correspond": 48, "command": 48, "line": 48, "census_summary_cell_count": 50, "datafram": 50, "valu": 50, "The": 52, "explain": 53, "paramet": 53, "split": 53, "dataload": 53, "make": 53, "build": 54, "process": 54, "depend": 55, "environ": 55, "verifi": 55, "your": 55, "develop": 55}, "envversion": {"sphinx.domains.c": 2, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 8, "sphinx.domains.index": 1, "sphinx.domains.javascript": 2, "sphinx.domains.math": 2, "sphinx.domains.python": 3, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "nbsphinx": 4, "sphinx.ext.intersphinx": 1, "sphinx": 57}, "alltitles": {"API Documentation": [[0, "api-documentation"]], "cellxgene_census.download_source_h5ad": [[1, "cellxgene-census-download-source-h5ad"]], "cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe": [[2, "cellxgene-census-experimental-ml-pytorch-experimentdatapipe"]], "cellxgene_census.experimental.ml.pytorch.Stats": [[3, "cellxgene-census-experimental-ml-pytorch-stats"]], "cellxgene_census.experimental.ml.pytorch.experiment_dataloader": [[4, "cellxgene-census-experimental-ml-pytorch-experiment-dataloader"]], "cellxgene_census.experimental.pp.get_highly_variable_genes": [[5, "cellxgene-census-experimental-pp-get-highly-variable-genes"]], "cellxgene_census.experimental.pp.highly_variable_genes": [[6, "cellxgene-census-experimental-pp-highly-variable-genes"]], "cellxgene_census.experimental.pp.mean_variance": [[7, "cellxgene-census-experimental-pp-mean-variance"]], "cellxgene_census.experimental.util.X_sparse_iter": [[8, "cellxgene-census-experimental-util-x-sparse-iter"]], "cellxgene_census.get_anndata": [[9, "cellxgene-census-get-anndata"]], "cellxgene_census.get_census_version_description": [[10, "cellxgene-census-get-census-version-description"]], "cellxgene_census.get_census_version_directory": [[11, "cellxgene-census-get-census-version-directory"]], "cellxgene_census.get_default_soma_context": [[12, "cellxgene-census-get-default-soma-context"]], "cellxgene_census.get_presence_matrix": [[13, "cellxgene-census-get-presence-matrix"]], "cellxgene_census.get_source_h5ad_uri": [[14, "cellxgene-census-get-source-h5ad-uri"]], "cellxgene_census.open_soma": [[15, "cellxgene-census-open-soma"]], "What\u2019s new?": [[16, "what-s-new"]], "2023": [[16, "id1"]], "R package cellxgene.census V1 is out!": [[17, "r-package-cellxgene-census-v1-is-out"]], "Installation and usage": [[17, "installation-and-usage"]], "Census R package is made possible by tiledbsoma": [[17, "census-r-package-is-made-possible-by-tiledbsoma"]], "Efficient access to single-cell data for >33M cells from R": [[17, "efficient-access-to-single-cell-data-for-33m-cells-from-r"]], "Easy-to-use handles to the cloud-hosted Census data": [[17, "easy-to-use-handles-to-the-cloud-hosted-census-data"]], "Querying and reading single-cell metadata from Census": [[17, "querying-and-reading-single-cell-metadata-from-census"]], "Exporting Census slices to Seurat and SingleCellExperiment": [[17, "exporting-census-slices-to-seurat-and-singlecellexperiment"]], "Streaming data incrementally in chunks": [[17, "streaming-data-incrementally-in-chunks"]], "Memory-efficient implementations of commonly used single-cell methods": [[18, "memory-efficient-implementations-of-commonly-used-single-cell-methods"]], "Efficient calculation of average and variance gene expression across millions of cells": [[18, "efficient-calculation-of-average-and-variance-gene-expression-across-millions-of-cells"]], "How it works": [[18, "how-it-works"], [18, "id1"]], "Example: KRAS and AQP4 average and variance expression in lung epithelial cells": [[18, "example-kras-and-aqp4-average-and-variance-expression-in-lung-epithelial-cells"]], "Efficient calculation of highly variable genes across millions of cells": [[18, "efficient-calculation-of-highly-variable-genes-across-millions-of-cells"]], "Example: Finding highly variable genes for all cells of the human esophagus": [[18, "example-finding-highly-variable-genes-for-all-cells-of-the-human-esophagus"]], "Introducing a normalized layer and pre-calculated cell and gene statistics in Census": [[19, "introducing-a-normalized-layer-and-pre-calculated-cell-and-gene-statistics-in-census"]], "Description of new data added to Census": [[19, "description-of-new-data-added-to-census"]], "Added a new library-size normalized layer": [[19, "added-a-new-library-size-normalized-layer"]], "Enhanced gene metadata": [[19, "enhanced-gene-metadata"]], "Enhanced cell metadata": [[19, "enhanced-cell-metadata"]], "How to use the new features": [[19, "how-to-use-the-new-features"]], "Exporting the normalized data to existing single-cell toolkits": [[19, "exporting-the-normalized-data-to-existing-single-cell-toolkits"]], "Accessing library-size normalized data layer via TileDB-SOMA": [[19, "accessing-library-size-normalized-data-layer-via-tiledb-soma"]], "Utilizing pre-calculated stats for querying obs and var": [[19, "utilizing-pre-calculated-stats-for-querying-obs-and-var"]], "Help us improve these data additions": [[19, "help-us-improve-these-data-additions"]], "CZ CELLxGENE Discover Census in AWS": [[20, "cz-cellxgene-discover-census-in-aws"]], "Census data available in AWS": [[20, "census-data-available-in-aws"]], "Data specifications": [[20, "data-specifications"]], "Data release versioning": [[20, "data-release-versioning"]], "How to access AWS Census data": [[20, "how-to-access-aws-census-data"]], "AWS CLI for programatic downloads": [[20, "aws-cli-for-programatic-downloads"]], "CELLxGENE Census API (Python and R)": [[20, "cellxgene-census-api-python-and-r"]], "TileDB-SOMA API (Python and R)": [[20, "tiledb-soma-api-python-and-r"]], "FAQ": [[21, "faq"]], "Why should I use the Census?": [[21, "why-should-i-use-the-census"]], "What data is contained in the Census?": [[21, "what-data-is-contained-in-the-census"]], "How do I cite the use of the Census for a publication?": [[21, "how-do-i-cite-the-use-of-the-census-for-a-publication"]], "Why does the Census not have a normalized layer or embeddings?": [[21, "why-does-the-census-not-have-a-normalized-layer-or-embeddings"]], "How does the Census differentiate from other tools?": [[21, "how-does-the-census-differentiate-from-other-tools"]], "Can I query human and mouse data in a single query?": [[21, "can-i-query-human-and-mouse-data-in-a-single-query"]], "Where are the Census data hosted?": [[21, "where-are-the-census-data-hosted"]], "Can I retrieve the original H5AD datasets from which the Census was built?": [[21, "can-i-retrieve-the-original-h5ad-datasets-from-which-the-census-was-built"]], "How can I increase the performance of my queries?": [[21, "how-can-i-increase-the-performance-of-my-queries"]], "Can I use conda to install the Census Python API?": [[21, "can-i-use-conda-to-install-the-census-python-api"]], "How can I ask for support?": [[21, "how-can-i-ask-for-support"]], "How can I ask for new features?": [[21, "how-can-i-ask-for-new-features"]], "How can I contribute my data to the Census?": [[21, "how-can-i-contribute-my-data-to-the-census"]], "Why do I get an ArraySchema error when opening the Census?": [[21, "why-do-i-get-an-arrayschema-error-when-opening-the-census"]], "Why do I get an error when running import cellxgene_census on Databricks?": [[21, "why-do-i-get-an-error-when-running-import-cellxgene-census-on-databricks"]], "Census data releases": [[22, "census-data-releases"]], "What is a Census data release?": [[22, "what-is-a-census-data-release"]], "Long-term supported (LTS) Census releases": [[22, "long-term-supported-lts-census-releases"]], "Weekly Census releases (latest)": [[22, "weekly-census-releases-latest"]], "List of LTS Census data releases": [[22, "list-of-lts-census-data-releases"]], "LTS 2023-12-15": [[22, "lts-2023-12-15"]], "Version information": [[22, "version-information"], [22, "id1"], [22, "id4"]], "Cell and donor counts": [[22, "cell-and-donor-counts"], [22, "id2"], [22, "id5"]], "Cell metadata": [[22, "cell-metadata"], [22, "id3"], [22, "id6"], [34, "Cell-metadata"]], "Cell embbedings": [[22, "cell-embbedings"]], "LTS 2023-07-25": [[22, "lts-2023-07-25"]], "LTS 2023-05-15": [[22, "lts-2023-05-15"]], "\ud83d\udd34 Errata \ud83d\udd34": [[22, "errata"]], "Duplicate observations with  is_primary_data = True": [[22, "duplicate-observations-with-is-primary-data-true"]], "Installation": [[23, "installation"], [25, "installation"], [55, "installation"]], "Requirements": [[23, "requirements"], [36, "Requirements"], [38, "Requirements"], [40, "Requirements"]], "Python": [[23, "python"]], "R": [[23, "r"]], "CZ CELLxGENE Discover Census": [[24, "cz-cellxgene-discover-census"], [33, "cz-cellxgene-discover-census"]], "Citing the Census": [[24, "citing-the-census"], [33, "citing-the-census"]], "Census Capabilities": [[24, "census-capabilities"], [33, "census-capabilities"]], "Census Data and Schema": [[24, "census-data-and-schema"], [33, "census-data-and-schema"]], "Census Data Releases": [[24, "census-data-releases"], [33, "census-data-releases"]], "Questions, Feedback and Issues": [[24, "questions-feedback-and-issues"], [33, "questions-feedback-and-issues"]], "Coming Soon!": [[24, "coming-soon"], [33, "coming-soon"]], "Projects and Tools Using Census": [[24, "projects-and-tools-using-census"], [33, "projects-and-tools-using-census"]], "Quick start": [[25, "quick-start"], [42, "Quick-start"], [47, "Quick-start"]], "Python quick start": [[25, "python-quick-start"]], "Querying a slice of cell metadata": [[25, "querying-a-slice-of-cell-metadata"], [25, "id1"]], "Obtaining a slice as AnnData": [[25, "obtaining-a-slice-as-anndata"]], "Memory-efficient queries": [[25, "memory-efficient-queries"], [25, "id2"]], "R quick start": [[25, "r-quick-start"]], "Obtaining a slice as a Seurat or SingleCellExperiment object": [[25, "obtaining-a-slice-as-a-seurat-or-singlecellexperiment-object"]], "Census data and schema": [[26, "census-data-and-schema"]], "Schema": [[26, "schema"], [28, "schema"]], "Census summary info \"census_info\"": [[26, "census-summary-info-census-info"]], "Census single-cell data \"census_data\"": [[26, "census-single-cell-data-census-data"]], "Data included in the Census": [[26, "data-included-in-the-census"]], "SOMA objects": [[26, "soma-objects"]], "CELLxGENE Census Mirroring": [[27, "cellxgene-census-mirroring"]], "CZ CELLxGENE Discover Census Schema": [[28, "cz-cellxgene-discover-census-schema"]], "Census overview": [[28, "census-overview"]], "Definitions": [[28, "definitions"], [29, "definitions"]], "Census Schema versioning": [[28, "census-schema-versioning"]], "Data included": [[28, "data-included"]], "Species": [[28, "species"]], "Multi-species data constraints": [[28, "multi-species-data-constraints"]], "Assays": [[28, "assays"], [37, "Assays"]], "Data matrix types": [[28, "data-matrix-types"]], "Sample types": [[28, "sample-types"]], "Repeated data": [[28, "repeated-data"]], "Data encoding and organization": [[28, "data-encoding-and-organization"]], "Census information census_obj[\"census_info\"] - SOMACollection": [[28, "census-information-census-obj-census-info-somacollection"]], "Census metadata \u2013 census_obj\u200b\u200b[\"census_info\"][\"summary\"] \u2013 SOMADataFrame": [[28, "census-metadata-census-obj-census-info-summary-somadataframe"]], "Census table of CELLxGENE Discover datasets \u2013 census_obj[\"census_info\"][\"datasets\"] \u2013 SOMADataFrame": [[28, "census-table-of-cellxgene-discover-datasets-census-obj-census-info-datasets-somadataframe"]], "Census summary cell counts  \u2013 census_obj[\"census_info\"][\"summary_cell_counts\"] \u2013 SOMADataframe": [[28, "census-summary-cell-counts-census-obj-census-info-summary-cell-counts-somadataframe"]], "Census Data \u2013 census_obj[\"census_data\"][organism] \u2013 SOMAExperiment": [[28, "census-data-census-obj-census-data-organism-somaexperiment"]], "Matrix Data, count (raw) matrix \u2013 census_obj[\"census_data\"][organism].ms[\"RNA\"].X[\"raw\"] \u2013 SOMASparseNDArray": [[28, "matrix-data-count-raw-matrix-census-obj-census-data-organism-ms-rna-x-raw-somasparsendarray"]], "Matrix Data, normalized count matrix \u2013 census_obj[\"census_data\"][organism].ms[\"RNA\"].X[\"normalized\"] \u2013 SOMASparseNDArray": [[28, "matrix-data-normalized-count-matrix-census-obj-census-data-organism-ms-rna-x-normalized-somasparsendarray"]], "Feature metadata \u2013 census_obj[\"census_data\"][organism].ms[\"RNA\"].var \u2013 SOMADataFrame": [[28, "feature-metadata-census-obj-census-data-organism-ms-rna-var-somadataframe"]], "Feature dataset presence matrix \u2013 census_obj[\"census_data\"][organism].ms[\"RNA\"][\"feature_dataset_presence_matrix\"] \u2013 SOMASparseNDArray": [[28, "feature-dataset-presence-matrix-census-obj-census-data-organism-ms-rna-feature-dataset-presence-matrix-somasparsendarray"]], "Cell metadata \u2013 census_obj[\"census_data\"][organism].obs \u2013 SOMADataFrame": [[28, "cell-metadata-census-obj-census-data-organism-obs-somadataframe"]], "Changelog": [[28, "changelog"]], "Version 1.3.0": [[28, "version-1-3-0"]], "Version 1.2.0": [[28, "version-1-2-0"]], "Version 1.1.0": [[28, "version-1-1-0"]], "Version 1.0.0": [[28, "version-1-0-0"]], "Version 0.1.1": [[28, "version-0-1-1"]], "Version 0.1.0": [[28, "version-0-1-0"]], "Version 0.0.1": [[28, "version-0-0-1"]], "CZ CELLxGENE Discover Census storage & release policy": [[29, "cz-cellxgene-discover-census-storage-release-policy"]], "Census data storage policy": [[29, "census-data-storage-policy"]], "Census release information json": [[29, "census-release-information-json"]], "Census \u201cwhat\u2019s new?\u201d article editorial guidelines": [[30, "census-what-s-new-article-editorial-guidelines"]], "Location": [[30, "location"]], "Guidelines": [[30, "guidelines"], [31, "guidelines"]], "Title": [[30, "title"], [31, "title"]], "Date & author": [[30, "date-author"]], "Introduction": [[30, "introduction"], [31, "introduction"]], "Sections": [[30, "sections"], [31, "sections"]], "Example article": [[30, "example-article"]], "Census API notebook/vignette editorial guidelines": [[31, "census-api-notebook-vignette-editorial-guidelines"]], "Table of Contents": [[31, "table-of-contents"]], "is_primary_data knowledge reinforcement": [[31, "is-primary-data-knowledge-reinforcement"]], "Example notebook/vignette": [[31, "example-notebook-vignette"]], "Python tutorials": [[32, "python-tutorials"]], "Exporting data": [[32, "exporting-data"]], "[NEW! \ud83d\ude80] Using integrated embeddings and models": [[32, "new-using-integrated-embeddings-and-models"]], "Uderstanding Census data": [[32, "uderstanding-census-data"]], "Analyzing Census data": [[32, "analyzing-census-data"]], "Scalable computing": [[32, "scalable-computing"]], "Scalable machine learning": [[32, "scalable-machine-learning"]], "Learning about the CZ CELLxGENE Census": [[34, "Learning-about-the-CZ-CELLxGENE-Census"]], "Opening the Census": [[34, "Opening-the-Census"], [41, "Opening-the-Census"], [44, "Opening-the-Census"]], "Census organization": [[34, "Census-organization"]], "Main Census components": [[34, "Main-Census-components"]], "Census summary info": [[34, "Census-summary-info"]], "Census data": [[34, "Census-data"]], "Gene metadata": [[34, "Gene-metadata"]], "Census summary content tables": [[34, "Census-summary-content-tables"]], "Cell counts by cell metadata": [[34, "Cell-counts-by-cell-metadata"]], "Example: cell metadata included in the summary counts table": [[34, "Example:-cell-metadata-included-in-the-summary-counts-table"]], "Example: cell counts for each sequencing assay in human data": [[34, "Example:-cell-counts-for-each-sequencing-assay-in-human-data"]], "Example: number of microglial cells in the Census": [[34, "Example:-number-of-microglial-cells-in-the-Census"]], "Understanding Census contents beyond the summary tables": [[34, "Understanding-Census-contents-beyond-the-summary-tables"]], "Example: all cell types available in human": [[34, "Example:-all-cell-types-available-in-human"]], "Example: cell types available in human liver": [[34, "Example:-cell-types-available-in-human-liver"]], "Example: diseased T cells in human tissues": [[34, "Example:-diseased-T-cells-in-human-tissues"]], "Integrating multi-dataset slices of data": [[35, "Integrating-multi-dataset-slices-of-data"]], "Finding and fetching data from mouse liver (10X Genomics and Smart-Seq2)": [[35, "Finding-and-fetching-data-from-mouse-liver-(10X-Genomics-and-Smart-Seq2)"]], "Gene-length normalization of Smart-Seq2 data.": [[35, "Gene-length-normalization-of-Smart-Seq2-data."]], "Integration with scvi-tools": [[35, "Integration-with-scvi-tools"]], "Inspecting data prior to integration": [[35, "Inspecting-data-prior-to-integration"]], "Data integration with scVI": [[35, "Data-integration-with-scVI"]], "Integration with batch defined as dataset_id": [[35, "Integration-with-batch-defined-as-dataset_id"]], "Integration with batch defined as dataset_id + donor_id": [[35, "Integration-with-batch-defined-as-dataset_id-+-donor_id"]], "Integration with batch defined as dataset_id + donor_id + assay_ontology_term_id + suspension_type": [[35, "Integration-with-batch-defined-as-dataset_id-+-donor_id-+-assay_ontology_term_id-+-suspension_type"]], "Exploring biologically relevant clusters in Census embeddings": [[36, "Exploring-biologically-relevant-clusters-in-Census-embeddings"]], "Background": [[36, "Background"], [47, "Background"]], "Imports and function definitions": [[36, "Imports-and-function-definitions"]], "Melanocytes in eye": [[36, "Melanocytes-in-eye"]], "Sample and fetch 150k cells from eye tissue": [[36, "Sample-and-fetch-150k-cells-from-eye-tissue"]], "Observations": [[36, "Observations"], [36, "id1"], [36, "id2"]], "Retinal bipolar neurons in eye": [[36, "Retinal-bipolar-neurons-in-eye"]], "Dopaminergic neurons in brain": [[36, "Dopaminergic-neurons-in-brain"]], "Sample and fetch 150k cells from brain tissue": [[36, "Sample-and-fetch-150k-cells-from-brain-tissue"]], "Pulmonary ionocytes in lung (Tabula Sapiens)": [[36, "Pulmonary-ionocytes-in-lung-(Tabula-Sapiens)"]], "Fetch lung cells from Tabula Sapiens": [[36, "Fetch-lung-cells-from-Tabula-Sapiens"]], "Exploring all data from a tissue": [[37, "Exploring-all-data-from-a-tissue"]], "Learning about the lung data in the Census": [[37, "Learning-about-the-lung-data-in-the-Census"]], "Learning about cells of lung data": [[37, "Learning-about-cells-of-lung-data"]], "Datasets": [[37, "Datasets"]], "Disease": [[37, "Disease"]], "Sex": [[37, "Sex"]], "Cell vs nucleus": [[37, "Cell-vs-nucleus"]], "Cell types": [[37, "Cell-types"]], "Sub-tissues": [[37, "Sub-tissues"]], "Learning about genes of lung data": [[37, "Learning-about-genes-of-lung-data"]], "Summary of lung metadata": [[37, "Summary-of-lung-metadata"]], "Fetching all single-cell human lung data from the Census": [[37, "Fetching-all-single-cell-human-lung-data-from-the-Census"]], "Calculating QC metrics of the lung data": [[37, "Calculating-QC-metrics-of-the-lung-data"]], "Creating a normalized expression layer and embeddings": [[37, "Creating-a-normalized-expression-layer-and-embeddings"]], "Geneformer for cell class prediction and data projection": [[38, "Geneformer-for-cell-class-prediction-and-data-projection"]], "System requirements": [[38, "System-requirements"], [40, "System-requirements"]], "Downloading example data": [[38, "Downloading-example-data"], [40, "Downloading-example-data"]], "Downloading the fine-tuned Geneformer model": [[38, "Downloading-the-fine-tuned-Geneformer-model"]], "Importing required packages": [[38, "Importing-required-packages"]], "Preparing data and model": [[38, "Preparing-data-and-model"]], "Preparing single-cell data": [[38, "Preparing-single-cell-data"]], "Preparing data from model": [[38, "Preparing-data-from-model"]], "Using the Geneformer fine-tuned model for cell subclass inference": [[38, "Using-the-Geneformer-fine-tuned-model-for-cell-subclass-inference"]], "Loading tokenized data": [[38, "Loading-tokenized-data"]], "Performing inference of cell subclass": [[38, "Performing-inference-of-cell-subclass"]], "Inspecting inference results": [[38, "Inspecting-inference-results"]], "Using the Geneformer fine-tuned model for data projection": [[38, "Using-the-Geneformer-fine-tuned-model-for-data-projection"]], "Generating Geneformer embeddings for 10X PBMC 3K data": [[38, "Generating-Geneformer-embeddings-for-10X-PBMC-3K-data"]], "Joining Geneformer embeddings from 10X PBMC 3K data with other Census datasets": [[38, "Joining-Geneformer-embeddings-from-10X-PBMC-3K-data-with-other-Census-datasets"]], "Normalizing full-length gene sequencing data": [[39, "Normalizing-full-length-gene-sequencing-data"]], "Opening the census": [[39, "Opening-the-census"], [49, "Opening-the-census"]], "Fetching full-length example sequencing data (Smart-Seq)": [[39, "Fetching-full-length-example-sequencing-data-(Smart-Seq)"]], "Normalizing expression to account for gene length": [[39, "Normalizing-expression-to-account-for-gene-length"]], "Validation through clustering exploration": [[39, "Validation-through-clustering-exploration"]], "scVI for cell type prediction and data projection": [[40, "scVI-for-cell-type-prediction-and-data-projection"]], "Downloading the trained scVI model": [[40, "Downloading-the-trained-scVI-model"]], "Using the scVI pretrained model for data projection": [[40, "Using-the-scVI-pretrained-model-for-data-projection"]], "Using the scVI pretrained model for cell cell type inference.": [[40, "Using-the-scVI-pretrained-model-for-cell-cell-type-inference."]], "Summarizing cell and gene metadata": [[41, "Summarizing-cell-and-gene-metadata"]], "Summarizing cell metadata": [[41, "Summarizing-cell-metadata"]], "Example: Summarize all cell types": [[41, "Example:-Summarize-all-cell-types"]], "Example: Summarize a subset of cell types, selected with a value_filter": [[41, "Example:-Summarize-a-subset-of-cell-types,-selected-with-a-value_filter"]], "Full Census metadata stats": [[41, "Full-Census-metadata-stats"]], "Access CELLxGENE collaboration embeddings (scVI, Geneformer)": [[42, "Access-CELLxGENE-collaboration-embeddings-(scVI,-Geneformer)"]], "Storage format": [[42, "Storage-format"], [47, "Storage-format"]], "Query cells and load associated embeddings": [[42, "Query-cells-and-load-associated-embeddings"], [47, "Query-cells-and-load-associated-embeddings"]], "Loading embeddings into an AnnData obsm slot": [[42, "Loading-embeddings-into-an-AnnData-obsm-slot"]], "AnnData embeddings via cellxgene_census.get_anndata()": [[42, "AnnData-embeddings-via-cellxgene_census.get_anndata()"], [47, "AnnData-embeddings-via-cellxgene_census.get_anndata()"]], "AnnData embeddings via ExperimentAxisQuery": [[42, "AnnData-embeddings-via-ExperimentAxisQuery"], [47, "AnnData-embeddings-via-ExperimentAxisQuery"]], "Loading embeddings into a Scipy matrices and NumPy arrays": [[42, "Loading-embeddings-into-a-Scipy-matrices-and-NumPy-arrays"]], "Computing on X using online (incremental) algorithms": [[43, "Computing-on-X-using-online-(incremental)-algorithms"]], "Incremental count and mean calculation.": [[43, "Incremental-count-and-mean-calculation."]], "Incremental variance calculation": [[43, "Incremental-variance-calculation"]], "Counting cells per gene, grouped by dataset_id": [[43, "Counting-cells-per-gene,-grouped-by-dataset_id"]], "Genes measured in each cell (dataset presence matrix)": [[44, "Genes-measured-in-each-cell-(dataset-presence-matrix)"]], "Fetching the IDs of the Census datasets": [[44, "Fetching-the-IDs-of-the-Census-datasets"]], "Fetching the dataset presence matrix": [[44, "Fetching-the-dataset-presence-matrix"]], "Identifying genes measured in a specific dataset.": [[44, "Identifying-genes-measured-in-a-specific-dataset."]], "Identifying datasets that measured specific genes": [[44, "Identifying-datasets-that-measured-specific-genes"]], "Identifying all genes measured in a dataset": [[44, "Identifying-all-genes-measured-in-a-dataset"]], "Exploring the Census Datasets table": [[45, "Exploring-the-Census-Datasets-table"]], "Fetching the datasets table": [[45, "Fetching-the-datasets-table"]], "Fetching the expression data from a single dataset": [[45, "Fetching-the-expression-data-from-a-single-dataset"]], "Downloading the original source H5AD file of a dataset.": [[45, "Downloading-the-original-source-H5AD-file-of-a-dataset."]], "Understanding and filtering out duplicate cells": [[46, "Understanding-and-filtering-out-duplicate-cells"]], "Why are there duplicate cells in the Census?": [[46, "Why-are-there-duplicate-cells-in-the-Census?"]], "An example: duplicate cells in the Tabula Muris Senis data": [[46, "An-example:-duplicate-cells-in-the-Tabula-Muris-Senis-data"]], "Filtering out duplicate cells": [[46, "Filtering-out-duplicate-cells"]], "Filtering out duplicate cells when reading the obs data frame.": [[46, "Filtering-out-duplicate-cells-when-reading-the-obs-data-frame."]], "Filtering out duplicate cells when creating an AnnData": [[46, "Filtering-out-duplicate-cells-when-creating-an-AnnData"]], "Filtering out duplicate cells for out-of-core operations.": [[46, "Filtering-out-duplicate-cells-for-out-of-core-operations."]], "Access CELLxGENE-hosted embeddings": [[47, "Access-CELLxGENE-hosted-embeddings"]], "Contents": [[47, "Contents"]], "Load an embedding into an AnnData obsm slot": [[47, "Load-an-embedding-into-an-AnnData-obsm-slot"]], "Load an embedding into a dense NumPy array": [[47, "Load-an-embedding-into-a-dense-NumPy-array"]], "Load embeddings and fetch associated Census data": [[47, "Load-embeddings-and-fetch-associated-Census-data"]], "Embedding Metadata": [[47, "Embedding-Metadata"]], "Querying data using the gget cellxgene module": [[48, "Querying-data-using-the-gget-cellxgene-module"]], "Install gget and set up cellxgene module": [[48, "Install-gget-and-set-up-cellxgene-module"]], "Fetch an AnnData object by selecting gene(s), tissue(s) and cell type(s)": [[48, "Fetch-an-AnnData-object-by-selecting-gene(s),-tissue(s)-and-cell-type(s)"]], "Plot a dot plot similar to those shown on the CZ CELLxGENE Discover Gene Expression": [[48, "Plot-a-dot-plot-similar-to-those-shown-on-the-CZ-CELLxGENE-Discover-Gene-Expression"]], "Fetch only cell metadata (corresponds to AnnData.obs)": [[48, "Fetch-only-cell-metadata-(corresponds-to-AnnData.obs)"]], "Use gget cellxgene from the command line": [[48, "Use-gget-cellxgene-from-the-command-line"]], "Querying and fetching the single-cell data and cell/gene metadata.": [[49, "Querying-and-fetching-the-single-cell-data-and-cell/gene-metadata."]], "Querying expression data": [[49, "Querying-expression-data"]], "Querying cell metadata (obs)": [[49, "Querying-cell-metadata-(obs)"]], "Querying gene metadata (var)": [[49, "Querying-gene-metadata-(var)"]], "Exploring pre-calculated summary cell counts": [[50, "Exploring-pre-calculated-summary-cell-counts"]], "Fetching the census_summary_cell_counts dataframe": [[50, "Fetching-the-census_summary_cell_counts-dataframe"]], "Creating summary counts beyond pre-calculated values.": [[50, "Creating-summary-counts-beyond-pre-calculated-values."]], "Experimental Highly Variable Genes API": [[51, "Experimental-Highly-Variable-Genes-API"]], "get_highly_variable_genes": [[51, "get_highly_variable_genes"]], "highly_variable_genes": [[51, "highly_variable_genes"]], "Out-of-core (incremental) mean and variance calculation": [[52, "Out-of-core-(incremental)-mean-and-variance-calculation"]], "The mean and variance API": [[52, "The-mean-and-variance-API"]], "Example: calculate mean and variance for a slice of the Census": [[52, "Example:-calculate-mean-and-variance-for-a-slice-of-the-Census"]], "Training a PyTorch Model": [[53, "Training-a-PyTorch-Model"]], "Open the Census": [[53, "Open-the-Census"]], "Create an ExperimentDataPipe": [[53, "Create-an-ExperimentDataPipe"]], "ExperimentDataPipe class explained": [[53, "ExperimentDataPipe-class-explained"]], "ExperimentDataPipe parameters explained": [[53, "ExperimentDataPipe-parameters-explained"]], "Split the dataset": [[53, "Split-the-dataset"]], "Create the DataLoader": [[53, "Create-the-DataLoader"]], "Define the model": [[53, "Define-the-model"]], "Train the model": [[53, "Train-the-model"]], "Make predictions with the model": [[53, "Make-predictions-with-the-model"]], "Python API": [[54, "module-cellxgene_census"]], "Open/retrieve Cell Census data": [[54, "open-retrieve-cell-census-data"]], "Get slice as AnnData": [[54, "get-slice-as-anndata"]], "Feature presence matrix": [[54, "feature-presence-matrix"]], "Versioning of Cell Census builds": [[54, "versioning-of-cell-census-builds"]], "Experimental: Machine Learning": [[54, "experimental-machine-learning"]], "Experimental: Processing": [[54, "experimental-processing"]], "Experimental: Utility": [[54, "experimental-utility"]], "Dependencies": [[55, "dependencies"]], "Set up Python environment": [[55, "set-up-python-environment"]], "Verify your installation": [[55, "verify-your-installation"]], "Latest development version": [[55, "latest-development-version"]], "What is SOMA": [[56, "what-is-soma"]]}, "indexentries": {"download_source_h5ad() (in module cellxgene_census)": [[1, "cellxgene_census.download_source_h5ad"]], "experimentdatapipe (class in cellxgene_census.experimental.ml.pytorch)": [[2, "cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe"]], "__init__() (cellxgene_census.experimental.ml.pytorch.experimentdatapipe method)": [[2, "cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe.__init__"]], "stats (class in cellxgene_census.experimental.ml.pytorch)": [[3, "cellxgene_census.experimental.ml.pytorch.Stats"]], "__init__() (cellxgene_census.experimental.ml.pytorch.stats method)": [[3, "cellxgene_census.experimental.ml.pytorch.Stats.__init__"]], "experiment_dataloader() (in module cellxgene_census.experimental.ml.pytorch)": [[4, "cellxgene_census.experimental.ml.pytorch.experiment_dataloader"]], "get_highly_variable_genes() (in module cellxgene_census.experimental.pp)": [[5, "cellxgene_census.experimental.pp.get_highly_variable_genes"]], "highly_variable_genes() (in module cellxgene_census.experimental.pp)": [[6, "cellxgene_census.experimental.pp.highly_variable_genes"]], "mean_variance() (in module cellxgene_census.experimental.pp)": [[7, "cellxgene_census.experimental.pp.mean_variance"]], "x_sparse_iter() (in module cellxgene_census.experimental.util)": [[8, "cellxgene_census.experimental.util.X_sparse_iter"]], "get_anndata() (in module cellxgene_census)": [[9, "cellxgene_census.get_anndata"]], "get_census_version_description() (in module cellxgene_census)": [[10, "cellxgene_census.get_census_version_description"]], "get_census_version_directory() (in module cellxgene_census)": [[11, "cellxgene_census.get_census_version_directory"]], "get_default_soma_context() (in module cellxgene_census)": [[12, "cellxgene_census.get_default_soma_context"]], "get_presence_matrix() (in module cellxgene_census)": [[13, "cellxgene_census.get_presence_matrix"]], "get_source_h5ad_uri() (in module cellxgene_census)": [[14, "cellxgene_census.get_source_h5ad_uri"]], "open_soma() (in module cellxgene_census)": [[15, "cellxgene_census.open_soma"]], "cellxgene_census": [[54, "module-cellxgene_census"]], "module": [[54, "module-cellxgene_census"]]}})
\ No newline at end of file
+Search.setIndex({"docnames": ["README", "_autosummary/cellxgene_census.download_source_h5ad", "_autosummary/cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe", "_autosummary/cellxgene_census.experimental.ml.pytorch.Stats", "_autosummary/cellxgene_census.experimental.ml.pytorch.experiment_dataloader", "_autosummary/cellxgene_census.experimental.pp.get_highly_variable_genes", "_autosummary/cellxgene_census.experimental.pp.highly_variable_genes", "_autosummary/cellxgene_census.experimental.pp.mean_variance", "_autosummary/cellxgene_census.experimental.util.X_sparse_iter", "_autosummary/cellxgene_census.get_anndata", "_autosummary/cellxgene_census.get_census_version_description", "_autosummary/cellxgene_census.get_census_version_directory", "_autosummary/cellxgene_census.get_default_soma_context", "_autosummary/cellxgene_census.get_presence_matrix", "_autosummary/cellxgene_census.get_source_h5ad_uri", "_autosummary/cellxgene_census.open_soma", "articles", "articles/2023/20230808-r_api_release", "articles/2023/20230919-out_of_core_methods", "articles/2023/20231012-normalized_layer_precalc_stats", "cellxgene_census_aws_open_data", "cellxgene_census_docsite_FAQ", "cellxgene_census_docsite_data_release_info", "cellxgene_census_docsite_installation", "cellxgene_census_docsite_landing", "cellxgene_census_docsite_quick_start", "cellxgene_census_docsite_schema", "cellxgene_census_mirroring", "cellxgene_census_schema", "cellxgene_census_storage_and_release_policy", "census_article_guidelines", "census_notebook_guidelines", "examples", "index", "notebooks/analysis_demo/comp_bio_census_info", "notebooks/analysis_demo/comp_bio_data_integration_scvi", "notebooks/analysis_demo/comp_bio_embedding_exploration", "notebooks/analysis_demo/comp_bio_explore_and_load_lung_data", "notebooks/analysis_demo/comp_bio_geneformer_prediction", "notebooks/analysis_demo/comp_bio_normalizing_full_gene_sequencing", "notebooks/analysis_demo/comp_bio_scvi_model_use", "notebooks/analysis_demo/comp_bio_summarize_axis_query", "notebooks/api_demo/census_access_maintained_embeddings", "notebooks/api_demo/census_citation_generation", "notebooks/api_demo/census_compute_over_X", "notebooks/api_demo/census_dataset_presence", "notebooks/api_demo/census_datasets", "notebooks/api_demo/census_duplicated_cells", "notebooks/api_demo/census_embedding", "notebooks/api_demo/census_gget_demo", "notebooks/api_demo/census_query_extract", "notebooks/api_demo/census_summary_cell_counts", "notebooks/experimental/highly_variable_genes", "notebooks/experimental/mean_variance", "notebooks/experimental/pytorch", "python-api", "setup", "soma"], "filenames": ["README.md", "_autosummary/cellxgene_census.download_source_h5ad.rst", "_autosummary/cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe.rst", "_autosummary/cellxgene_census.experimental.ml.pytorch.Stats.rst", "_autosummary/cellxgene_census.experimental.ml.pytorch.experiment_dataloader.rst", "_autosummary/cellxgene_census.experimental.pp.get_highly_variable_genes.rst", "_autosummary/cellxgene_census.experimental.pp.highly_variable_genes.rst", "_autosummary/cellxgene_census.experimental.pp.mean_variance.rst", "_autosummary/cellxgene_census.experimental.util.X_sparse_iter.rst", "_autosummary/cellxgene_census.get_anndata.rst", "_autosummary/cellxgene_census.get_census_version_description.rst", "_autosummary/cellxgene_census.get_census_version_directory.rst", "_autosummary/cellxgene_census.get_default_soma_context.rst", "_autosummary/cellxgene_census.get_presence_matrix.rst", "_autosummary/cellxgene_census.get_source_h5ad_uri.rst", "_autosummary/cellxgene_census.open_soma.rst", "articles.rst", "articles/2023/20230808-r_api_release.md", "articles/2023/20230919-out_of_core_methods.md", "articles/2023/20231012-normalized_layer_precalc_stats.md", "cellxgene_census_aws_open_data.md", "cellxgene_census_docsite_FAQ.md", "cellxgene_census_docsite_data_release_info.md", "cellxgene_census_docsite_installation.md", "cellxgene_census_docsite_landing.md", "cellxgene_census_docsite_quick_start.md", "cellxgene_census_docsite_schema.md", "cellxgene_census_mirroring.md", "cellxgene_census_schema.md", "cellxgene_census_storage_and_release_policy.md", "census_article_guidelines.md", "census_notebook_guidelines.md", "examples.rst", "index.rst", "notebooks/analysis_demo/comp_bio_census_info.ipynb", "notebooks/analysis_demo/comp_bio_data_integration_scvi.ipynb", "notebooks/analysis_demo/comp_bio_embedding_exploration.ipynb", "notebooks/analysis_demo/comp_bio_explore_and_load_lung_data.ipynb", "notebooks/analysis_demo/comp_bio_geneformer_prediction.ipynb", "notebooks/analysis_demo/comp_bio_normalizing_full_gene_sequencing.ipynb", "notebooks/analysis_demo/comp_bio_scvi_model_use.ipynb", "notebooks/analysis_demo/comp_bio_summarize_axis_query.ipynb", "notebooks/api_demo/census_access_maintained_embeddings.ipynb", "notebooks/api_demo/census_citation_generation.ipynb", "notebooks/api_demo/census_compute_over_X.ipynb", "notebooks/api_demo/census_dataset_presence.ipynb", "notebooks/api_demo/census_datasets.ipynb", "notebooks/api_demo/census_duplicated_cells.ipynb", "notebooks/api_demo/census_embedding.ipynb", "notebooks/api_demo/census_gget_demo.ipynb", "notebooks/api_demo/census_query_extract.ipynb", "notebooks/api_demo/census_summary_cell_counts.ipynb", "notebooks/experimental/highly_variable_genes.ipynb", "notebooks/experimental/mean_variance.ipynb", "notebooks/experimental/pytorch.ipynb", "python-api.rst", "setup.rst", "soma.rst"], "titles": ["API Documentation", "cellxgene_census.download_source_h5ad", "cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe", "cellxgene_census.experimental.ml.pytorch.Stats", "cellxgene_census.experimental.ml.pytorch.experiment_dataloader", "cellxgene_census.experimental.pp.get_highly_variable_genes", "cellxgene_census.experimental.pp.highly_variable_genes", "cellxgene_census.experimental.pp.mean_variance", "cellxgene_census.experimental.util.X_sparse_iter", "cellxgene_census.get_anndata", "cellxgene_census.get_census_version_description", "cellxgene_census.get_census_version_directory", "cellxgene_census.get_default_soma_context", "cellxgene_census.get_presence_matrix", "cellxgene_census.get_source_h5ad_uri", "cellxgene_census.open_soma", "What\u2019s new?", "R package <code class=\"docutils literal notranslate\"><span class=\"pre\">cellxgene.census</span></code> V1 is out!", "Memory-efficient implementations of commonly used single-cell methods", "Introducing a normalized layer and pre-calculated cell and gene statistics in Census", "CZ CELLxGENE Discover Census in AWS", "FAQ", "Census data releases", "Installation", "CZ CELLxGENE Discover Census", "Quick start", "Census data and schema", "CELLxGENE Census Mirroring", "CZ CELLxGENE Discover Census Schema", "CZ CELLxGENE Discover Census storage &amp; release policy", "Census \u201cwhat\u2019s new?\u201d article editorial guidelines", "Census API notebook/vignette editorial guidelines", "Python tutorials", "CZ CELLxGENE Discover Census", "Learning about the CZ CELLxGENE Census", "Integrating multi-dataset slices of data", "Exploring biologically relevant clusters in Census embeddings", "Exploring all data from a tissue", "Geneformer for cell class prediction and data projection", "Normalizing full-length gene sequencing data", "scVI for cell type prediction and data projection", "Summarizing cell and gene metadata", "Access CELLxGENE collaboration embeddings (scVI, Geneformer)", "Generating citations for Census slices", "Computing on X using online (incremental) algorithms", "Genes measured in each cell (dataset presence matrix)", "Exploring the Census Datasets table", "Understanding and filtering out duplicate cells", "Access CELLxGENE-hosted embeddings", "Querying data using the gget cellxgene module", "Querying and fetching the single-cell data and cell/gene metadata.", "Exploring pre-calculated summary cell counts", "Experimental Highly Variable Genes API", "Out-of-core (incremental) mean and variance calculation", "Training a PyTorch Model", "Python API", "Installation", "What is SOMA"], "terms": {"The": [0, 1, 2, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 54, 55, 57], "websit": 0, "i": [0, 1, 2, 3, 5, 6, 7, 8, 9, 11, 12, 13, 14, 15, 16, 18, 19, 20, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56], "current": [0, 8, 11, 18, 19, 24, 25, 27, 33, 34, 35, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 57], "host": [0, 20, 22, 23, 24, 27, 28, 29, 31, 32, 33, 36, 38, 40, 42, 55, 56, 57], "http": [0, 4, 6, 8, 11, 21, 23, 27, 31, 35, 37, 38, 39, 40, 43, 48, 49, 56], "chanzuckerberg": [0, 19, 23, 24, 28, 30, 31, 33, 49, 56], "github": [0, 8, 19, 21, 24, 28, 31, 33, 48, 49, 56], "io": [0, 6, 35, 37, 39], "cellxgen": [0, 10, 11, 14, 16, 19, 21, 22, 23, 25, 26, 30, 31, 32, 35, 36, 37, 38, 39, 40, 43, 46, 47, 55, 56, 57], "censu": [0, 1, 5, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 23, 25, 35, 40, 42, 44, 49, 51, 52, 56, 57], "site": [0, 21, 30, 31, 35, 37, 39], "rebuilt": 0, "each": [0, 2, 8, 11, 18, 19, 21, 22, 25, 26, 27, 28, 32, 35, 36, 37, 38, 39, 41, 42, 43, 44, 46, 48, 49, 51, 52, 54, 55], "time": [0, 11, 18, 21, 28, 47, 49, 54], "tag": [0, 20, 22, 29], "creat": [0, 6, 20, 21, 24, 25, 26, 29, 31, 33, 34, 35, 38, 42, 43, 46, 48, 52], "repo": [0, 23, 55], "which": [0, 2, 4, 5, 6, 7, 8, 9, 11, 13, 15, 17, 18, 19, 26, 27, 28, 29, 30, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54], "happen": [0, 11, 27], "releas": [0, 10, 11, 17, 19, 23, 25, 27, 28, 30, 34, 35, 37, 39, 41, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54], "includ": [0, 11, 18, 20, 21, 24, 30, 31, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 50, 51, 53, 55, 57], "regener": 0, "sphinx": 0, "python": [0, 2, 17, 18, 19, 22, 24, 30, 31, 33, 34, 38, 41, 43, 45, 48, 49, 50, 57], "doc": [0, 4, 17, 21, 30, 31, 35, 54], "r": [0, 16, 19, 21, 22, 24, 30, 31, 33, 37, 38, 57], "pkgdown": 0, "check": [0, 17, 24, 25, 27, 33, 35, 39, 45, 48, 56], "git": [0, 56], "simpli": [0, 21, 38, 56], "copi": [0, 12, 20, 29, 35, 36, 37, 39, 40], "dure": [0, 35, 38], "rebuild": 0, "see": [0, 2, 4, 5, 6, 8, 18, 19, 20, 21, 23, 25, 26, 28, 35, 36, 37, 38, 39, 47, 48, 49, 50, 52, 54, 55], "vignettes_": 0, "further": [0, 12, 19, 30, 36, 41, 48], "explan": [0, 30, 31, 47], "A": [0, 2, 4, 6, 7, 8, 11, 12, 13, 14, 15, 20, 22, 24, 25, 26, 27, 28, 29, 30, 32, 33, 34, 35, 37, 38, 39, 40, 45, 46, 47, 48, 49, 50], "docsit": 0, "can": [0, 2, 4, 5, 6, 12, 15, 17, 18, 19, 20, 22, 24, 25, 26, 27, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 53, 54, 56], "trigger": 0, "manual": 0, "through": [0, 23, 24, 33, 40, 48, 50, 54], "workflow_dispatch": 0, "run": [0, 35, 36, 38, 40, 49, 54, 56], "workflow": [0, 32, 38, 48], "thi": [0, 1, 2, 3, 4, 5, 6, 8, 11, 14, 17, 18, 19, 20, 21, 22, 25, 26, 27, 28, 29, 30, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 56], "should": [0, 20, 22, 28, 29, 30, 31, 34, 35, 36, 37, 39, 41, 46, 54, 56], "done": [0, 5, 6, 7, 18, 20, 37, 39, 52, 54], "bug": [0, 24, 33], "found": [0, 13, 15, 17, 24, 33, 35, 36, 37, 39, 40, 46, 50], "necessari": [0, 18, 24, 31, 33, 36], "In": [0, 18, 19, 22, 23, 24, 28, 31, 33, 34, 35, 36, 37, 38, 42, 44, 45, 47, 48, 52, 54, 56], "order": [0, 2, 8, 22, 31, 38, 54], "test": [0, 38, 41, 54, 56], "chang": [0, 19, 28, 29], "local": [0, 2, 20, 36, 46, 54, 56], "first": [0, 2, 13, 17, 18, 23, 25, 35, 37, 38, 39, 41, 42, 43, 44, 45, 47, 48, 54], "instal": [0, 30], "requir": [0, 2, 20, 28, 29, 37, 41, 42, 48, 49, 54], "pip": [0, 21, 23, 49, 56], "txt": 0, "brew": 0, "pandoc": 0, "mac": 0, "o": [0, 12, 38, 40, 49], "Then": [0, 35, 38, 39, 42, 43, 48, 54], "And": [0, 19, 20, 25, 34, 35, 37, 38, 39, 42, 43, 47, 48, 50], "follow": [0, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 29, 30, 31, 33, 34, 36, 37, 38, 40, 42, 47, 48, 50, 53, 54, 56], "command": [0, 21, 34, 38, 40], "cd": [0, 56], "make": [0, 17, 23, 28, 35, 37, 38, 39, 44, 56], "html": [0, 4, 6, 21, 35, 37, 39], "gener": [0, 3, 6, 18, 21, 22, 24, 28, 32, 33, 34, 35, 36, 48, 49], "_build": 0, "index": [0, 2, 5, 7, 8, 9, 13, 26, 28, 36, 38, 40, 42, 44, 45, 46, 52, 53], "dataset_id": [1, 6, 14, 18, 28, 31, 34, 36, 37, 38, 39, 40, 42, 43, 45, 46, 47, 48, 49, 50, 53], "str": [1, 2, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 28, 35, 36, 38, 49], "to_path": [1, 46], "census_vers": [1, 5, 10, 14, 15, 19, 22, 25, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54], "stabl": [1, 4, 5, 6, 11, 14, 15, 17, 22, 23, 25, 34, 35, 37, 39, 41, 44, 45, 46, 47, 49, 50, 51, 52, 53, 54], "none": [1, 2, 3, 5, 6, 9, 10, 11, 12, 15, 28, 36, 37, 38, 44, 49], "download": [1, 18, 21, 42, 48, 55], "sourc": [1, 14, 15, 20, 23, 28, 29, 48, 49, 54, 56], "h5ad": [1, 10, 11, 14, 15, 20, 28, 29, 35, 38, 39, 43, 45, 49, 55], "dataset": [1, 5, 6, 13, 17, 19, 20, 22, 24, 26, 30, 31, 32, 33, 34, 36, 39, 40, 41, 42, 43, 44, 47, 48, 49, 50, 51], "given": [1, 2, 8, 10, 18, 20, 22, 28, 29, 36, 37, 44, 45, 46, 48, 54], "user": [1, 6, 12, 14, 17, 18, 19, 20, 21, 24, 26, 27, 30, 31, 33, 35, 37, 38, 39, 40, 44, 52, 54], "specifi": [1, 2, 5, 6, 7, 11, 12, 15, 19, 20, 22, 25, 27, 29, 34, 35, 37, 39, 41, 44, 45, 46, 47, 49, 50, 51, 52, 53, 54], "file": [1, 15, 20, 21, 22, 27, 28, 29, 34, 38, 40, 41, 49], "name": [1, 2, 5, 6, 8, 10, 11, 14, 20, 22, 25, 26, 28, 29, 30, 34, 35, 36, 37, 39, 41, 43, 44, 47, 48, 49, 50, 52, 55], "paramet": [1, 2, 4, 5, 6, 7, 8, 9, 10, 12, 13, 14, 15, 35, 37, 39], "fetch": [1, 2, 5, 6, 9, 17, 30, 31, 32, 38, 40, 42, 43, 47, 54], "origin": [1, 2, 8, 19, 28, 36, 37, 38, 40, 47, 54], "associ": [1, 8, 28, 32, 37, 38], "where": [1, 2, 7, 8, 27, 28, 29, 31, 35, 36, 37, 39, 41, 42, 44, 47, 48, 52, 53, 54], "written": [1, 5, 9, 30], "must": [1, 2, 5, 6, 23, 25, 28, 29, 30, 31, 36, 47, 56], "alreadi": [1, 36, 40], "exist": [1, 14, 20, 21, 24, 27, 29, 33, 34, 37, 38, 47], "version": [1, 8, 10, 11, 14, 15, 17, 19, 21, 23, 27, 31, 34, 35, 36, 38, 40, 41, 42, 43, 45, 47, 48, 49, 50], "default": [1, 2, 5, 7, 8, 9, 11, 12, 14, 15, 22, 27, 35, 39, 44, 49, 53, 54], "rais": [1, 4, 5, 6, 10, 13, 14, 15, 34, 41], "valueerror": [1, 4, 5, 6, 10, 13, 15], "path": [1, 15, 20, 28, 29, 38, 49], "e": [1, 2, 6, 7, 8, 15, 19, 20, 22, 24, 26, 27, 28, 29, 30, 33, 34, 36, 37, 41, 42, 44, 45, 46, 47, 48, 49, 52, 56], "overwrit": 1, "an": [1, 2, 4, 5, 7, 8, 9, 11, 15, 17, 18, 19, 20, 23, 24, 25, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 41, 43, 44, 46, 50, 53, 55, 56], "lifecycl": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15], "matur": [1, 9, 10, 11, 13, 14, 15, 34, 36], "get_source_h5ad_uri": [1, 15, 46], "look": [1, 15, 19, 27, 34, 35, 37, 38, 39, 40, 42, 47, 48, 49, 50, 54, 57], "up": [1, 15, 18, 40, 44, 47], "locat": [1, 12, 15, 21, 27, 29, 46, 48, 50], "exampl": [1, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 17, 19, 20, 21, 23, 25, 28, 29, 32, 35, 36, 37, 42, 44, 48, 49, 50, 54, 56], "8e47ed12": 1, "c658": 1, "4252": [1, 37, 45], "b126": 1, "381df8d52a3d": 1, "tmp": [1, 15], "data": [1, 2, 3, 4, 5, 6, 8, 10, 11, 14, 18, 23, 25, 27, 30, 31, 36, 41, 42, 43, 44, 45, 51, 52, 53, 54, 57], "class": [2, 3, 13, 25, 26, 32, 42, 44, 45, 48], "experi": [2, 5, 8, 9, 12, 19, 26, 31, 36, 41, 42, 45, 46, 48, 51, 52, 54], "measurement_nam": [2, 5, 8, 9, 13, 18, 19, 25, 36, 38, 40, 42, 43, 44, 45, 47, 48, 52, 53, 54], "raw": [2, 5, 6, 7, 8, 9, 18, 19, 25, 26, 34, 36, 37, 42, 44, 47, 48, 53, 54], "x_name": [2, 5, 8, 9, 19, 42, 48, 54], "x": [2, 5, 6, 7, 8, 9, 19, 25, 26, 30, 31, 34, 35, 36, 37, 38, 39, 40, 42, 47, 48, 53, 54], "obs_queri": [2, 18, 19, 25, 42, 44, 47, 48, 52, 53, 54], "axisqueri": [2, 18, 19, 25, 42, 44, 47, 48, 52, 53, 54], "var_queri": [2, 18, 44, 54], "obs_column_nam": [2, 17, 19, 25, 54], "sequenc": [2, 5, 6, 9, 24, 26, 31, 32, 33, 35, 36, 37, 45, 46, 48], "batch_siz": [2, 4, 54], "int": [2, 3, 4, 5, 6, 7, 8, 9, 28, 36, 40, 44], "1": [2, 7, 8, 12, 18, 19, 20, 22, 25, 26, 27, 29, 30, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 56], "shuffl": [2, 4, 54], "bool": [2, 7, 8, 11, 36], "fals": [2, 7, 8, 11, 12, 18, 20, 28, 29, 34, 35, 36, 37, 38, 40, 47, 49, 50, 51, 52, 53], "seed": [2, 35, 54], "return_sparse_x": 2, "soma_chunk_s": [2, 54], "use_eager_fetch": [2, 8], "true": [2, 5, 7, 8, 11, 18, 23, 28, 29, 31, 34, 35, 36, 37, 39, 40, 41, 44, 47, 48, 49, 50, 51, 52, 53, 54], "iter": [2, 8, 17, 19, 20, 25, 30, 42, 44, 47, 54, 57], "style": [2, 54], "datapip": [2, 4, 54], "read": [2, 3, 8, 9, 13, 18, 19, 20, 21, 24, 25, 26, 28, 33, 34, 35, 36, 37, 38, 39, 41, 43, 44, 45, 46, 48, 50, 51, 52, 54], "ob": [2, 5, 6, 7, 8, 9, 17, 20, 25, 26, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 51, 52, 53, 54], "from": [2, 7, 10, 13, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 34, 39, 40, 42, 44, 45, 47, 48, 50, 51, 52, 53, 54, 56], "soma": [2, 3, 5, 6, 7, 8, 9, 10, 11, 12, 15, 17, 18, 21, 22, 24, 25, 27, 28, 29, 31, 33, 34, 36, 40, 41, 42, 44, 45, 46, 48, 52, 53, 54, 55], "base": [2, 5, 11, 17, 18, 19, 24, 26, 29, 33, 34, 36, 37, 38, 40, 42, 47, 48, 49, 50, 52, 57], "upon": [2, 5, 15, 22, 34, 41, 52], "queri": [2, 5, 6, 7, 8, 9, 13, 18, 22, 24, 28, 31, 32, 33, 34, 35, 37, 40, 41, 44, 46, 47, 51, 52, 53, 54], "along": [2, 7, 17, 19, 29, 38, 53, 54], "var": [2, 5, 6, 7, 8, 9, 13, 18, 25, 26, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 48, 49, 52, 53, 54], "ax": [2, 7, 54], "provid": [2, 15, 20, 21, 22, 24, 25, 26, 27, 28, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 45, 46, 47, 48, 49, 51, 52, 54, 55], "over": [2, 6, 7, 8, 15, 19, 25, 44, 48, 49, 53], "when": [2, 4, 5, 6, 27, 28, 29, 36, 44, 48, 49, 51, 52, 54], "object": [2, 5, 9, 12, 13, 14, 15, 17, 19, 21, 24, 28, 30, 33, 34, 35, 36, 37, 41, 42, 43, 46, 48, 50, 54, 57], "pass": [2, 4, 12, 35, 40, 44, 49, 50, 54], "": [2, 6, 11, 17, 20, 21, 28, 31, 32, 34, 35, 36, 37, 38, 39, 40, 42, 44, 45, 47, 48, 50, 53, 54], "built": [2, 19, 24, 28, 33, 55, 57], "function": [2, 5, 6, 19, 21, 22, 34, 44, 48, 49, 51, 52, 54, 55], "batch": [2, 5, 6, 18, 31, 36, 38, 40, 44, 52, 54], "x_batch": [2, 54], "y_batch": [2, 54], "control": [2, 8, 18, 52, 54], "number": [2, 4, 5, 6, 7, 8, 11, 19, 22, 28, 37, 38, 39, 40, 42, 44, 46, 47, 48, 52, 53, 54, 55], "row": [2, 6, 7, 8, 13, 19, 25, 28, 34, 36, 37, 42, 44, 45, 46, 48, 49, 50, 51, 52, 53, 54], "ar": [2, 4, 6, 7, 8, 11, 15, 17, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 48, 49, 50, 52, 53, 54, 56], "return": [2, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 34, 36, 41, 42, 44, 45, 49, 50, 51, 52, 53, 54], "If": [2, 4, 5, 6, 7, 8, 11, 12, 15, 20, 21, 22, 23, 24, 27, 28, 29, 31, 33, 34, 37, 41, 47, 48, 49, 54, 56], "tensor": [2, 54], "have": [2, 11, 17, 19, 22, 23, 24, 28, 30, 33, 34, 35, 36, 39, 40, 41, 42, 44, 45, 48, 52, 54], "rank": [2, 5, 6, 52, 54], "0": [2, 3, 4, 5, 6, 7, 8, 9, 18, 19, 22, 25, 26, 27, 30, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 49, 50, 51, 52, 53, 54], "2415": 2, "dtype": [2, 5, 8, 9, 34, 35, 36, 37, 39, 41, 42, 43, 44, 47, 48, 50, 54], "torch": [2, 4, 54], "int64": [2, 8, 28, 34, 35, 37, 39, 41, 44, 47, 50], "encod": [2, 34, 35, 41, 42, 44, 48, 54], "For": [2, 5, 6, 7, 8, 17, 19, 20, 21, 23, 24, 25, 27, 28, 29, 30, 33, 34, 35, 36, 37, 38, 39, 40, 41, 44, 45, 47, 49, 50, 52, 54, 55, 56], "larger": [2, 21, 24, 25, 33, 36, 44, 57], "valu": [2, 5, 6, 7, 8, 9, 10, 13, 17, 18, 19, 21, 22, 26, 28, 29, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 47, 48, 49, 50, 52, 53, 54, 57], "2": [2, 10, 11, 12, 14, 15, 18, 20, 21, 22, 23, 25, 27, 29, 30, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 56], "dataload": [2, 4], "3": [2, 5, 6, 18, 21, 22, 23, 25, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 56], "2416": 2, "4": [2, 18, 22, 25, 28, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 54], "2417": 2, "whether": [2, 49], "dens": [2, 8, 21, 24, 26, 33], "spars": [2, 7, 8, 13, 21, 24, 25, 26, 31, 33, 35, 36, 37, 39, 42, 44, 45, 48], "model": [2, 5, 6, 22, 24, 28, 33, 35, 36, 42, 48, 52, 57], "support": [2, 4, 8, 20, 23, 24, 26, 27, 28, 29, 33, 36, 38, 49, 53, 54, 57], "us": [2, 3, 4, 5, 6, 7, 8, 11, 12, 15, 16, 20, 22, 23, 25, 26, 27, 28, 29, 30, 31, 34, 35, 36, 37, 39, 41, 42, 43, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57], "reduc": [2, 12, 19, 37, 42, 47, 48, 54], "memori": [2, 8, 12, 16, 17, 19, 21, 23, 24, 30, 32, 33, 41, 44, 46, 47, 49, 50, 54, 56, 57], "usag": [2, 8, 18, 20, 21, 25, 30, 35, 47, 54], "determin": [2, 28, 45, 54], "column": [2, 5, 6, 7, 8, 9, 25, 26, 28, 34, 36, 37, 38, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54], "element": [2, 7, 13, 42, 44, 45, 53], "alwai": [2, 8, 11, 26, 47], "soma_joinid": [2, 5, 7, 8, 9, 13, 18, 22, 25, 28, 34, 35, 36, 37, 39, 42, 43, 44, 45, 46, 48, 49, 50, 51, 52, 53], "datafram": [2, 5, 6, 7, 9, 13, 17, 19, 25, 26, 28, 34, 36, 37, 41, 42, 44, 45, 46, 48, 49, 50, 52, 53, 54], "equiaval": 2, "soma_dim_0": [2, 8, 42, 44, 47, 48], "matrix": [2, 7, 8, 13, 19, 21, 24, 25, 26, 32, 33, 34, 35, 36, 37, 39, 42, 48, 49], "remain": [2, 36], "string": [2, 6, 27, 28, 29, 48, 50, 54], "type": [2, 8, 13, 17, 20, 22, 25, 26, 29, 32, 35, 36, 38, 39, 42, 44, 45, 51, 54, 56], "integ": [2, 5, 9, 26, 29, 37, 39, 44, 54], "need": [2, 8, 23, 25, 31, 34, 35, 38, 40, 45, 47, 50, 56], "decod": [2, 48, 54], "obtain": [2, 18, 31, 34, 35, 37, 38, 40, 47, 50, 54], "call": [2, 6, 20, 22, 25, 27, 34, 35, 37, 39, 41, 44, 45, 46, 47, 49, 50, 51, 52, 53, 54], "its": [2, 12, 17, 19, 20, 22, 24, 26, 28, 33, 35, 38, 40, 41, 45, 47, 50, 54, 57], "inverse_transform": [2, 54], "method": [2, 3, 4, 5, 6, 12, 16, 19, 20, 21, 22, 34, 36, 39, 41, 42, 44, 46, 48, 50, 52, 54, 57], "exp_data_pip": 2, "obs_encod": [2, 54], "obs_attr_nam": 2, "encoded_valu": 2, "__init__": [2, 3, 44, 54], "construct": [2, 34, 36, 37, 45, 46, 48], "new": [2, 22, 24, 25, 28, 33, 35, 38, 49, 54], "measur": [2, 5, 9, 13, 18, 19, 26, 28, 32, 37, 39, 46, 48], "layer": [2, 5, 6, 7, 8, 9, 16, 24, 28, 30, 33, 35, 42, 45, 49, 53], "filter": [2, 5, 9, 11, 17, 18, 19, 21, 22, 24, 25, 26, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 49, 50, 51, 54], "axi": [2, 5, 7, 8, 9, 18, 26, 36, 37, 38, 39, 40, 41, 42, 44, 47, 48, 52, 53, 54], "all": [2, 5, 6, 9, 11, 17, 19, 20, 21, 22, 24, 25, 26, 28, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 42, 43, 44, 46, 47, 48, 49, 50, 51, 56, 57], "veri": [2, 51], "larg": [2, 8, 17, 34, 37, 44, 47, 48, 49, 50, 51], "gene": [2, 5, 6, 16, 17, 21, 24, 25, 26, 28, 30, 31, 32, 33, 36, 38, 40, 42, 47, 48, 54], "featur": [2, 13, 24, 25, 26, 30, 32, 33, 37, 38, 40, 42, 45, 48, 49, 52], "doe": [2, 14, 27, 40, 44, 48, 54], "onli": [2, 6, 7, 8, 11, 15, 18, 19, 22, 25, 26, 27, 28, 29, 34, 35, 36, 37, 38, 39, 41, 42, 44, 47, 48, 50, 52, 54], "result": [2, 5, 6, 7, 8, 11, 18, 25, 35, 36, 40, 41, 42, 44, 48, 50, 52, 53, 54], "being": [2, 54], "singl": [2, 5, 6, 8, 16, 20, 24, 27, 28, 30, 31, 32, 33, 34, 35, 36, 39, 45, 47, 48, 49, 54, 55, 57], "multipl": [2, 6, 8, 11, 24, 26, 28, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 50, 51], "perform": [2, 11, 18, 19, 22, 23, 24, 25, 33, 34, 35, 37, 39, 44, 47, 48, 50, 53, 54], "reason": [2, 11, 28, 29, 36], "two": [2, 19, 20, 26, 28, 31, 34, 35, 42, 48, 49, 50, 52], "step": [2, 8, 18, 21, 37, 38, 54], "global": [2, 36, 37, 54], "contigu": 2, "group": [2, 28, 34, 36, 38, 51], "chunk": [2, 7, 8, 21, 42, 47, 54], "random": [2, 35, 36, 37, 38, 40, 54], "within": [2, 25, 28, 30, 31, 34, 36, 48, 54], "sinc": [2, 4, 17, 21, 22, 30, 35, 37, 47, 49, 54], "retriev": [2, 3, 15, 17, 19, 27, 28, 32, 34, 42, 54], "keep": [2, 19, 38, 51, 56], "fix": [2, 21, 28, 54], "size": [2, 7, 8, 26, 28, 36, 38, 40, 42, 48, 51, 54], "ensur": [2, 19, 21, 25, 31, 34, 35, 37, 39, 41, 43, 44, 45, 46, 47, 49, 50, 51, 52, 53, 54], "ani": [2, 4, 5, 6, 8, 9, 12, 15, 17, 18, 19, 20, 21, 22, 24, 25, 28, 31, 33, 34, 36, 40, 42, 43, 44, 45, 46, 48, 51, 52, 54], "posit": [2, 8, 34, 37, 38, 44], "non": [2, 11, 18, 21, 26, 28, 31, 34, 36, 37, 38, 44, 47, 48, 50], "occur": [2, 5, 6, 21, 48], "would": [2, 35, 42, 47, 54], "second": [2, 13, 17, 30, 31, 42, 45, 48, 54, 56], "so": [2, 21, 34, 35, 36, 37, 38, 39, 40, 41, 44, 45, 54], "note": [2, 8, 17, 24, 26, 27, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 49, 50, 51, 54], "maintain": [2, 35, 42, 48], "proxim": [2, 37, 51], "even": [2, 48], "after": [2, 21, 30, 31, 37], "some": [2, 4, 8, 18, 28, 34, 35, 36, 37, 38, 39, 40, 47, 49, 56], "mai": [2, 5, 9, 11, 17, 21, 22, 23, 24, 28, 29, 30, 31, 33, 34, 35, 36, 44, 45, 46, 47, 48, 54], "suffici": [2, 21, 54, 56], "train": [2, 32, 35, 48], "process": [2, 4, 8, 18, 19, 21, 34, 38, 44, 47], "To": [2, 12, 17, 19, 21, 22, 23, 24, 28, 31, 33, 34, 35, 36, 37, 38, 39, 40, 43, 46, 47, 48, 49, 50, 54, 57], "end": [2, 28, 35, 36, 47], "treat": 2, "hyperparamet": 2, "tune": [2, 22, 42], "distributeddataparallel": 2, "partit": 2, "disjoint": [2, 26], "across": [2, 17, 21, 24, 25, 26, 28, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 50, 51], "worker": [2, 4], "As": [2, 18, 24, 25, 26, 28, 33, 35, 39, 42, 45, 48, 50, 53, 57], "set": [2, 8, 12, 15, 18, 19, 25, 29, 35, 36, 38, 40, 45, 52, 54], "still": [2, 35], "impact": [2, 36], "aspect": 2, "behavior": 2, "maximum": [2, 5, 6, 54], "util": [2, 4, 18, 21, 31, 36, 38, 40, 41, 44, 47, 48, 56], "better": [2, 28, 32], "also": [2, 8, 11, 18, 20, 21, 23, 36, 38, 40, 41, 45, 46, 47, 49, 50, 52, 54, 56], "more": [2, 5, 6, 17, 18, 19, 20, 21, 22, 23, 25, 28, 29, 34, 35, 36, 38, 39, 40, 41, 42, 44, 47, 48, 49, 50, 52, 54, 55], "granular": [2, 54], "detail": [2, 18, 20, 24, 25, 33, 35, 36, 48, 50, 54], "gib": 2, "ram": [2, 44, 49, 56], "per": [2, 6, 18, 19, 21, 28, 34, 37, 39, 45, 54], "cell": [2, 5, 6, 8, 10, 11, 14, 16, 20, 21, 24, 27, 29, 30, 31, 32, 33, 35, 39, 46, 52, 53, 54, 57], "request": [2, 20, 21, 24, 33, 38, 41, 44, 51, 52, 54], "assum": [2, 6, 36, 44, 54], "sparsiti": 2, "95": 2, "depend": [2, 17, 21, 23, 35, 38, 40], "next": [2, 17, 19, 20, 25, 54], "immedi": [2, 30, 31], "previous": [2, 36, 37], "made": [2, 36], "avail": [2, 6, 11, 18, 19, 21, 22, 23, 27, 29, 35, 37, 38, 42, 48, 49, 50, 52, 55], "via": [2, 3, 20, 21, 22, 23, 24, 25, 27, 33, 34, 35, 37, 38, 39, 40, 41, 46, 50, 54, 56, 57], "allow": [2, 17, 19, 40, 41, 47, 54], "network": 2, "filesystem": 2, "parallel": [2, 8, 44], "client": [2, 21], "side": 2, "potenti": [2, 36], "improv": [2, 8], "overal": [2, 54], "cost": [2, 8, 21], "doubl": [2, 28], "attribut": [2, 3, 38, 42, 48, 49, 54], "n_ob": [3, 25, 37, 38, 40, 42, 44, 46, 48, 49, 50], "nnz": [3, 7, 19, 28, 42, 48], "elaps": 3, "n_soma_chunk": 3, "statist": [3, 7, 16, 44, 51], "about": [3, 17, 19, 21, 24, 25, 28, 29, 31, 32, 33, 35, 39, 41, 42, 47, 48, 49, 50], "experimentdatapip": [3, 4], "api": [3, 6, 8, 18, 19, 22, 23, 24, 25, 27, 28, 30, 32, 33, 34, 35, 37, 39, 41, 45, 46, 49, 50, 54, 56, 57], "assess": [3, 36, 37], "throughput": 3, "attr": 3, "iterdatapip": [4, 54], "num_work": 4, "dataloader_kwarg": 4, "factori": 4, "safe": 4, "instanti": [4, 54], "work": [4, 17, 19, 23, 24, 33, 34, 56], "constructor": [4, 54], "param": [4, 11, 15], "applic": [4, 8, 48], "sampler": [4, 54], "batch_sampl": [4, 54], "collate_fn": [4, 54], "other": [4, 8, 18, 19, 28, 30, 34, 36, 39, 42, 44, 45, 46, 47, 48, 50, 56], "ha": [4, 5, 6, 17, 19, 24, 26, 28, 30, 31, 33, 34, 35, 38, 39, 42, 45, 47, 48, 56, 57], "been": [4, 17, 19, 22, 30, 48, 56], "chain": [4, 54], "load": [4, 17, 21, 24, 31, 33, 35, 37, 40, 43, 50, 54, 56], "main": [4, 21, 23, 26, 31, 36, 42, 47, 48], "addit": [4, 8, 9, 23, 24, 28, 31, 33, 34, 38, 40, 46, 49, 52, 53], "keyword": [4, 30], "argument": [4, 6, 15, 18, 19, 49, 50, 52, 53], "except": [4, 34, 36, 39, 50], "org": [4, 23, 43], "collect": [5, 9, 13, 15, 20, 22, 26, 29, 34, 37, 38, 39, 40, 43, 45, 49], "organ": [5, 9, 13, 17, 18, 19, 21, 24, 25, 26, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 50, 51, 52, 54], "rna": [5, 8, 9, 13, 18, 19, 21, 24, 25, 26, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54], "obs_value_filt": [5, 9, 17, 18, 19, 22, 25, 35, 36, 38, 39, 40, 42, 43, 46, 47, 48, 50, 52, 53], "obs_coord": [5, 8, 9, 36, 37], "byte": [5, 9], "slice": [5, 9, 18, 19, 21, 24, 30, 31, 32, 33, 34, 37, 42, 44, 45, 46, 48, 50, 57], "float": [5, 6, 9, 19, 47, 54], "datetime64": [5, 9], "timestamptyp": [5, 9], "arrai": [5, 8, 9, 13, 21, 24, 26, 33, 37, 39, 44, 45, 54], "chunkedarrai": [5, 9], "ndarrai": [5, 8, 9, 44, 48], "var_value_filt": [5, 9, 17, 19, 25, 43, 47, 50], "var_coord": [5, 8, 9, 37], "n_top_gen": [5, 6, 18, 35, 37, 39, 52], "1000": [5, 6, 8, 9, 18, 28, 35, 39], "flavor": [5, 6, 35, 37], "liter": [5, 6, 8], "seurat_v3": [5, 6, 35, 37, 52], "span": [5, 6, 21, 36, 52], "batch_kei": [5, 6, 18, 35, 52], "max_loess_jitt": [5, 6], "1e": [5, 6, 54], "06": [5, 6, 29], "batch_key_func": [5, 6], "callabl": [5, 6], "conveni": [5, 20, 34, 41, 44, 45, 46, 50, 52, 57], "wrapper": [5, 9, 20, 34, 52], "convienc": [5, 9], "around": [5, 9, 25, 52], "highly_variable_gen": [5, 18, 35, 37, 38, 39], "build": [5, 9, 20, 21, 22, 23, 26, 28, 29, 34, 37, 42, 48, 49], "execut": [5, 9, 20, 47], "annot": [5, 6, 21, 26, 28, 34, 35, 37, 38, 40, 52], "variabl": [5, 6, 19, 21, 24, 25, 26, 28, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 50, 51, 54], "inform": [5, 6, 19, 20, 21, 24, 26, 27, 30, 31, 33, 34, 35, 36, 37, 38, 40, 46, 47, 48, 49, 50, 52, 55], "usual": [5, 9, 13, 18, 21, 54], "open_soma": [5, 8, 9, 12, 17, 18, 19, 20, 22, 25, 27, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 56], "one": [5, 8, 9, 13, 15, 21, 22, 26, 27, 28, 29, 30, 31, 34, 35, 36, 38, 40, 46, 47, 48, 49, 50, 54], "homo": [5, 9, 13, 17, 18, 19, 22, 25, 26, 28, 34, 37, 38, 40, 45, 47, 50, 51], "sapien": [5, 9, 13, 17, 18, 19, 22, 25, 26, 28, 34, 37, 38, 40, 45, 47, 50, 51], "mu": [5, 9, 13, 22, 28, 34, 35, 39, 46, 51], "musculu": [5, 9, 13, 22, 28, 34, 35, 39, 46, 51], "metadata": [5, 9, 18, 20, 21, 24, 26, 31, 32, 33, 35, 36, 38, 39, 40, 42, 44, 45, 46, 47, 51, 52, 54, 56], "value_filt": [5, 9, 17, 18, 19, 20, 22, 25, 34, 35, 36, 37, 39, 42, 43, 44, 47, 48, 50, 51, 52, 53, 54], "syntax": [5, 9], "coordin": [5, 8, 9, 36, 44], "list": [5, 6, 9, 20, 24, 26, 27, 28, 30, 31, 33, 34, 36, 37, 38, 40, 41, 45, 49, 50, 55], "select": [5, 6, 7, 9, 19, 25, 27, 31, 35, 36, 37, 38, 42, 45, 46, 47, 48, 50, 52], "fraction": [5, 6, 18, 52], "estim": [5, 6, 52], "loess": [5, 6, 52], "varianc": [5, 6, 7, 19, 28, 32, 52], "fit": [5, 6, 35, 40, 41, 44, 52], "combin": [5, 6, 17, 21, 28, 34, 35, 36, 37, 40, 41, 44, 45, 47, 50], "identifi": [5, 6, 11, 18, 22, 27, 29, 36, 39], "max_lowess_jitt": [5, 6, 52], "jitter": [5, 6, 37, 52], "add": [5, 6, 9, 19, 23, 28, 38, 39, 44, 48], "case": [5, 6, 26, 28, 34, 35, 36, 39, 42, 44, 47, 48, 52, 53, 54], "failur": [5, 6], "low": [5, 6, 21, 24, 33], "entri": [5, 6, 27], "count": [5, 6, 18, 19, 21, 24, 25, 26, 32, 33, 35, 37, 38, 39, 41, 46, 47, 50], "panda": [5, 6, 7, 21, 24, 25, 33, 34, 36, 37, 40, 41, 44, 45, 46, 50, 51, 52, 53, 54], "contain": [5, 6, 9, 10, 11, 13, 14, 15, 26, 27, 28, 29, 30, 31, 34, 35, 36, 37, 38, 39, 41, 43, 44, 45, 46, 47, 48, 49, 50, 51, 53, 54, 55], "paramat": [5, 6, 35], "subset": [5, 35, 36, 37, 38, 39, 40, 48, 53, 54], "match": [5, 38, 40, 41, 46, 48, 49, 50, 52], "hvg": [5, 6, 18, 52], "is_primary_data": [5, 18, 24, 26, 28, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54], "tissue_gener": [5, 9, 17, 18, 20, 25, 28, 34, 36, 37, 42, 46, 47, 48, 49, 50, 51, 52, 53, 54], "lung": [5, 9, 21, 28, 31, 34, 35, 38, 41, 45, 46, 47, 49, 50], "500": [5, 19, 21, 37, 39, 52], "anndata": [5, 9, 19, 20, 21, 24, 28, 33, 35, 36, 37, 38, 39, 40, 44, 46, 50, 57], "top": [5, 15, 18, 28, 29, 37, 41, 46, 51, 52], "mus_musculu": [5, 28, 39, 41, 44, 46, 47, 48, 49, 50, 52, 53], "get": [5, 10, 11, 15, 17, 18, 19, 24, 25, 31, 33, 34, 35, 36, 37, 38, 39, 40, 42, 43, 45, 46, 47, 48, 50, 57], "highli": [5, 6, 21, 32, 35, 36, 37, 38, 39, 40, 54, 56, 57], "just": [5, 18, 21, 34, 37, 44, 47, 49], "hvg_soma_id": 5, "highly_vari": [5, 18, 37, 38, 39, 52], "adata": [5, 19, 25, 28, 35, 36, 37, 38, 40, 42, 43, 46, 47, 48, 49, 50], "get_anndata": [5, 19, 25, 35, 36, 37, 38, 39, 40, 43, 46, 47, 50, 52], "experimentaxisqueri": [6, 7, 8, 52, 53], "scanpi": [6, 18, 21, 25, 31, 35, 36, 37, 38, 39, 40, 42, 46, 48, 49, 52, 55], "mimic": 6, "seurat": [6, 18, 19, 21, 23, 24, 30, 33, 57], "v3": [6, 18, 23, 25, 28, 34, 37, 50], "readthedoc": [6, 35, 37, 39], "en": [6, 35, 37, 39], "g": [6, 7, 15, 20, 22, 24, 26, 27, 28, 29, 30, 33, 34, 36, 41, 44, 46, 48, 49, 52, 56], "kei": [6, 28, 29, 34, 35, 36, 37, 42, 44, 48, 50], "convert": [6, 17, 25, 42, 44], "concaten": [6, 25, 35, 42, 47, 48, 53], "them": [6, 17, 20, 21, 35, 38, 42, 47, 48, 50], "option": [6, 11, 14, 15, 20, 23, 28, 29, 46, 49, 56], "defin": [6, 8, 21, 26, 27, 28, 29, 31, 34, 41, 44, 49, 50], "onc": [6, 11, 17, 22, 34, 41, 44, 54], "receiv": [6, 37], "seri": [6, 28, 37, 44], "ident": [6, 34], "those": [6, 18, 35, 37, 39, 44], "produc": 6, "donor_id": [6, 28, 31, 34, 37, 42, 46, 48, 49, 50, 53], "lambda": [6, 40], "batch0": 6, "99": 6, "els": [6, 36, 45, 54], "batch1": 6, "calculate_mean": [7, 18, 53], "calculate_vari": [7, 18, 53], "ddof": [7, 53], "nnz_onli": 7, "calcul": [7, 16, 28, 32, 35, 36, 38], "mean": [7, 18, 28, 31, 32, 52, 56], "accumul": [7, 18, 44], "fashion": [7, 17, 18, 30], "total": [7, 18, 21, 22, 26, 28, 34, 37, 39], "n": [7, 19, 21, 25, 26, 28, 34, 37, 39, 42, 43, 44, 48, 53], "correspond": [7, 11, 19, 20, 28, 31, 34, 36, 37, 38, 39, 40, 41, 42, 44, 47, 48, 50], "dimens": [7, 13, 26, 42, 45, 48, 54], "wise": [7, 37], "metric": [7, 31, 36, 40], "explicitli": [7, 19, 28, 48], "store": [7, 8, 13, 19, 26, 28, 29, 31, 34, 36, 38, 41, 42, 45, 48, 49], "comput": [7, 17, 18, 21, 24, 33, 34, 53, 54], "otherwis": [7, 28, 29, 47], "skip": [7, 8], "delta": [7, 44, 53], "degre": [7, 36, 53], "freedom": [7, 53], "divisor": [7, 53], "repres": [7, 17, 22, 26, 28, 37, 48, 53], "stride": 8, "65536": 8, "fmt": 8, "csr": [8, 13, 42], "csc": 8, "reindex_sparse_axi": 8, "tupl": [8, 42, 44], "spmatrix": 8, "deprec": [8, 27, 35], "8": [8, 18, 23, 25, 34, 35, 36, 37, 38, 39, 40, 42, 45, 47, 48, 49, 50, 52, 53, 54, 56], "remov": [8, 28, 35, 37, 47], "9": [8, 22, 25, 34, 35, 36, 37, 38, 39, 40, 41, 42, 45, 47, 48, 49, 50, 54], "pleas": [8, 17, 19, 20, 21, 24, 30, 33, 35, 36, 37, 38, 39, 40, 47, 49, 57], "blockwis": [8, 42, 48], "introduc": [8, 16, 36, 49], "tiledbsoma": [8, 12, 18, 19, 20, 25, 36, 38, 40, 42, 44, 47, 48, 52, 53, 54, 55], "5": [8, 22, 23, 25, 28, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 52, 53, 54], "pagin": 8, "peak": 8, "yield": [8, 36], "content": [8, 20, 22, 25, 26, 27, 28, 29, 30, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 49, 50, 51, 53, 54], "scipi": [8, 13, 21, 24, 31, 33, 35, 36, 37, 39, 45, 48], "csr_matrix": [8, 13, 31, 35, 39], "csc_matrix": 8, "position": [8, 44, 45], "j": [8, 28, 36, 43, 45, 46], "aka": [8, 44], "soma_dim_1": [8, 42, 44, 47, 48], "present": [8, 21, 24, 26, 28, 29, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 50, 51], "zero": [8, 18, 19, 26, 28, 36, 44, 48, 52], "layout": [8, 54], "thread": 8, "speed": [8, 18, 21], "instead": [8, 35, 36, 39, 49, 54], "reindex": 8, "respect": [8, 17, 19, 23, 28, 34, 36, 42, 49, 50], "streamlin": 8, "oper": [8, 12, 21, 25, 34, 41, 44, 50, 54], "slightli": 8, "prefer": [8, 34, 41, 46], "address": 8, "directli": [8, 17, 20, 21, 22, 32, 34, 36, 37, 41, 42, 46, 50, 54, 55], "wai": [8, 18, 34, 41, 42, 45, 47, 48, 50], "regardless": 8, "underli": [8, 36, 54, 55], "indptr": 8, "exp": [8, 38, 40], "census_data": [8, 17, 18, 19, 20, 25, 34, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54], "axis_queri": [8, 18, 19, 25, 42, 44, 47, 48, 52, 53], "obs_soma_joinid": [8, 48], "var_soma_joinid": 8, "x_chunk": 8, "com": [8, 11, 19, 21, 24, 27, 30, 31, 33, 38, 40, 43, 48, 49, 56], "tiledb": [8, 12, 15, 17, 21, 22, 23, 24, 25, 31, 33, 34, 41, 50, 57], "issu": [8, 19, 21, 22, 36], "1528": 8, "x_layer": [9, 19], "obsm_lay": [9, 36, 38, 40, 42], "column_nam": [9, 17, 19, 20, 25, 34, 36, 37, 41, 42, 43, 44, 46, 47, 48, 49, 50, 51], "axiscolumnnam": 9, "obsm": [9, 22, 26, 35, 36, 38, 40], "slot": [9, 22, 36], "brain": [9, 19, 25, 34, 44], "tissu": [9, 17, 19, 20, 22, 25, 28, 31, 32, 38, 39, 41, 42, 43, 44, 46, 47, 48, 50, 53], "censusversiondescript": [10, 11], "descript": [10, 11, 21, 24, 26, 28, 30, 33, 48, 50, 55], "directori": [10, 11, 23, 27, 29, 56], "dictionari": [10, 11, 12, 15, 27, 29, 34, 38, 48, 50], "unknown": [10, 37, 49, 50], "get_census_version_directori": 10, "entir": [10, 37, 41, 45, 54], "dict": [10, 11, 12, 15, 36, 40], "latest": [10, 11, 15, 19, 23, 29, 31, 34, 35, 41, 43, 45, 48, 49, 50], "release_d": [10, 11, 29], "release_build": [10, 11, 29], "2022": [10, 11, 14, 15, 28, 45, 46], "12": [10, 11, 14, 15, 19, 29, 34, 35, 36, 37, 38, 39, 40, 42, 45, 47, 48, 50], "01": [10, 11, 14, 35, 39, 42, 43, 48], "uri": [10, 11, 12, 14, 15, 20, 27, 29, 36, 38, 40, 46, 48, 55], "s3": [10, 11, 12, 14, 15, 20, 21, 23, 27, 28, 29, 36, 38, 40, 46, 48, 56], "public": [10, 11, 14, 20, 22, 27, 28, 29, 36, 38, 40, 43, 46, 48, 49], "s3_region": [10, 11, 14, 27, 29, 46], "u": [10, 11, 12, 14, 15, 20, 21, 23, 24, 27, 29, 33, 37, 44, 46, 48, 56], "west": [10, 11, 14, 15, 20, 21, 23, 27, 29, 46, 48, 56], "lt": [11, 19, 20, 29, 35, 42, 45], "retract": [11, 29], "flag": [11, 29, 54], "both": [11, 17, 19, 21, 28, 30, 31, 35, 36, 43, 47, 48, 50, 52, 54], "long": [11, 17, 20, 24, 29, 30, 31, 33, 54], "term": [11, 20, 24, 28, 29, 33, 34, 41, 44, 49, 54], "weekli": [11, 20, 24, 29, 33], "exclud": [11, 28, 37, 47, 54], "either": [11, 14, 20, 21, 28, 54], "date": [11, 20, 22, 26, 28, 29, 34, 48], "yyyi": [11, 22, 29, 30], "mm": [11, 22, 29], "dd": [11, 22, 29, 30], "alias": 11, "alia": [11, 29], "appear": [11, 28, 29, 34, 36, 54], "under": [11, 27, 28, 29, 31, 37, 39, 42], "again": [11, 49], "v": [11, 29, 35, 44], "most": [11, 18, 21, 22, 28, 34, 35, 36, 37, 38, 41, 47, 52, 54, 57], "recent": [11, 17, 22], "sequenti": 11, "increment": [11, 18, 32], "get_census_version_descript": 11, "census_version_nam": 11, "11": [11, 21, 23, 28, 34, 35, 36, 37, 38, 39, 40, 42, 45, 46, 47, 48, 49, 50, 53, 54, 56], "29": [11, 37, 38, 54], "v2": [11, 28, 34, 35, 37, 49, 53], "v1": [11, 16, 19, 26, 27, 28, 29, 34, 35, 37], "10": [11, 21, 22, 25, 30, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50, 53, 54], "15": [11, 20, 29, 30, 34, 35, 36, 37, 38, 39, 40, 42, 45, 47, 48, 49, 53], "30": [11, 22, 28, 35, 37, 38, 48, 54], "mistak": 11, "info_url": 11, "errata": 11, "replaced_bi": [11, 29], "tiledb_config": [12, 15, 20, 48], "somatiledbcontext": [12, 15, 48], "sensibl": 12, "custom": [12, 15, 20], "context": [12, 15, 19, 20, 25, 28, 34, 37, 41, 47, 48], "somaobject": 12, "open": [12, 14, 15, 17, 18, 19, 20, 22, 24, 25, 31, 33, 35, 37, 38, 42, 43, 48, 49, 52, 57], "replac": [12, 29, 36, 38, 40], "configur": [12, 15, 20, 21, 54], "overrid": [12, 15], "amount": [12, 49, 51], "ctx": [12, 20, 48], "py": [12, 15, 35, 37, 39, 49], "init_buffer_byt": [12, 15], "128": [12, 15, 22, 37, 52, 54], "1024": [12, 15], "c": [12, 17, 19, 23, 25, 35, 37, 38, 39, 40, 45, 46, 56], "my": [12, 20], "privat": [12, 20], "bucket": [12, 15, 20, 21, 23, 28, 29], "access": [12, 14, 21, 22, 24, 25, 26, 27, 28, 30, 31, 32, 33, 34, 36, 39, 41, 50, 51, 54, 57], "differ": [12, 21, 28, 34, 35, 36, 42, 45, 47, 48, 50], "region": [12, 14, 20, 21, 23, 27, 29, 48, 56], "vf": [12, 20, 48], "no_sign_request": [12, 20, 48], "east": [12, 20], "experiment": [12, 18, 23, 28, 32, 36, 38, 48, 53, 54], "presenc": [13, 26, 30, 31, 32, 36, 37, 39], "deafult": 13, "csr_arrai": 13, "cannot": [13, 15, 28], "321x60554": 13, "numpi": [13, 21, 24, 31, 33, 35, 36, 37, 38, 39, 40, 44, 45, 54], "uint8": [13, 45], "6441269": 13, "compress": [13, 42, 45], "format": [13, 20, 28, 29, 30, 44, 45, 55], "censusloc": 14, "guarante": [14, 24, 28, 33, 34, 35, 42], "interest": [14, 24, 26, 33, 34, 36, 45, 47, 49], "keyerror": 14, "do": [14, 19, 23, 25, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 46, 48, 50, 51, 53, 56], "cb5efdb0": 14, "f91c": 14, "4cbd": 14, "9ad4": 14, "9d4fa41c572d": 14, "mirror": 15, "suitabl": [15, 48], "chosen": [15, 27], "automat": [15, 21, 31, 34, 41], "take": [15, 18, 34, 35, 37, 38, 39, 42, 47, 48, 49, 50, 54, 56, 57], "preced": 15, "get_default_soma_context": [15, 20], "level": [15, 26, 28, 29, 30, 31, 34, 38, 44, 46, 47, 49, 51, 52], "It": [15, 21, 22, 26, 28, 30, 31, 34, 48, 52], "manag": [15, 19, 25, 34, 41, 51, 52], "close": [15, 17, 18, 19, 25, 34, 35, 36, 37, 39, 41, 42, 43, 46, 48, 50, 51], "exit": 15, "neither": 15, "invalid": [15, 44], "updat": [15, 18, 21, 28, 30, 35, 37, 39, 44, 48, 49], "specif": [15, 21, 22, 24, 26, 29, 33, 34, 36, 41, 44, 47, 50], "31": [15, 37, 38, 54], "rather": [15, 37, 44], "than": [15, 17, 19, 21, 23, 24, 25, 28, 30, 33, 34, 36, 37, 44, 57], "packag": [16, 21, 23, 24, 25, 30, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 48, 49, 50, 52, 53, 56], "out": [16, 19, 21, 22, 24, 26, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 49, 50, 51, 54, 56, 57], "effici": [16, 19, 21, 24, 31, 32, 33, 47, 49, 57], "implement": [16, 21, 24, 28, 33, 44, 52, 54, 57], "commonli": [16, 49], "normal": [16, 20, 22, 24, 25, 26, 30, 31, 32, 33, 34, 36, 40, 48, 50, 52, 53], "pre": [16, 18, 21, 29, 32, 34, 38, 47, 48], "publish": [17, 18, 19, 21, 22, 24, 28, 30, 33], "august": [17, 30], "7th": 17, "2023": [17, 18, 19, 20, 24, 25, 27, 28, 29, 30, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54], "By": [17, 18, 19, 30, 34, 39, 49], "pablo": [17, 18, 19, 30], "garcia": [17, 18, 19, 30], "nieto": [17, 18, 19, 30], "team": [17, 18, 19, 21, 30], "announc": [17, 18, 19, 30], "come": [17, 25, 30, 35, 36, 37], "our": [17, 19, 21, 25, 30, 34, 35, 36, 38, 40, 42, 48], "back": [17, 30, 35, 38, 54], "now": [17, 18, 19, 25, 30, 31, 34, 35, 37, 38, 39, 42, 43, 45, 46, 47, 48, 50, 53, 54, 56], "biologist": 17, "largest": [17, 21, 30], "standard": [17, 21, 24, 26, 33, 41, 44], "aggreg": [17, 30], "compos": [17, 26, 30], "60k": [17, 21, 30], "With": [17, 18, 19, 30, 34, 36, 39, 42, 48, 50, 54], "few": [17, 18, 32, 36, 38, 39, 47, 48, 49, 56], "hundr": [17, 30], "bigger": [17, 30], "quickli": [17, 22, 34, 35], "basic": [17, 35, 36, 37, 38, 39, 41, 42, 46, 48, 54], "structur": [17, 24, 29, 33, 34, 36], "downstream": [17, 18, 19, 25, 48], "analysi": [17, 19, 25, 28, 30, 32, 34, 35, 36, 37, 39, 41, 47, 48], "instruct": [17, 21, 25], "learn": [17, 28, 31, 35, 36, 39, 41, 47, 48, 50], "sure": [17, 39], "resourc": [17, 27, 37], "quick": [17, 20, 21, 24, 32, 33, 34, 51, 54], "start": [17, 20, 21, 22, 24, 32, 33, 34, 35, 37], "guid": [17, 20, 31, 35], "refer": [17, 19, 20, 21, 24, 25, 28, 30, 33, 35, 36, 38, 40, 50], "tutori": [17, 18, 21, 22, 24, 25, 33, 36, 37, 38, 39, 40, 42, 44, 46, 47, 48, 50, 51, 52, 53, 54], "reli": 17, "capabl": [17, 30, 32, 36, 45, 57], "shown": [17, 28, 29, 34, 36, 42, 54], "section": [17, 20, 28, 34, 37, 38, 42, 47, 48], "czi": [17, 21, 24, 33, 55], "develop": [17, 22, 23, 30, 35, 37, 49], "upgrad": [17, 21, 49], "beta": [17, 34, 37, 38], "here": [17, 18, 21, 24, 25, 26, 28, 29, 31, 33, 35, 36, 47, 48, 49, 54], "ever": 17, "grow": 17, "cz": [17, 21, 22, 26, 32, 37, 39, 43, 46, 47], "discov": [17, 21, 22, 26, 31, 34, 37, 38, 42, 43, 46, 47, 48, 55], "accompani": 17, "ontologi": [17, 38, 49], "map": [17, 28, 34, 37, 38, 40, 44, 45, 46], "cl": [17, 28, 34, 37, 38, 41, 50, 51, 53], "uberon": [17, 28, 34, 37, 41, 49, 50, 51, 53], "you": [17, 19, 21, 22, 23, 24, 25, 26, 31, 32, 33, 34, 35, 37, 38, 39, 40, 41, 42, 44, 46, 47, 48, 49, 50, 51, 54, 56], "find": [17, 19, 22, 26, 31, 34, 36, 38, 39, 40, 41, 42, 45, 48, 52], "schema": [17, 19, 20, 21, 22, 29, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51], "page": [17, 20, 21, 22, 25, 26, 35, 36, 38, 40, 42, 48, 57], "research": [17, 19, 21, 24, 33], "session": [17, 20, 23], "librari": [17, 21, 22, 23, 25, 26, 28, 34, 37, 54], "your": [17, 19, 21, 23, 24, 32, 33, 41, 46, 47, 48, 51], "navig": 17, "human": [17, 19, 25, 26, 28, 29, 31, 32, 35, 36, 38, 41, 42, 45, 46, 47, 50, 51], "300k": [17, 25], "microgli": [17, 20, 25], "neuron": [17, 19, 20, 25, 34, 38, 45, 51], "femal": [17, 20, 25, 37, 47, 49, 50, 53], "donor": [17, 28, 37, 45, 46, 49], "somadatafram": [17, 25, 34, 41, 50], "cell_metadata": [17, 20, 25, 43], "homo_sapien": [17, 18, 19, 20, 25, 26, 28, 34, 36, 37, 38, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50, 51, 54], "arrow": [17, 19, 21, 24, 25, 30, 33], "tabl": [17, 19, 25, 26, 32, 35, 36, 37, 39, 43, 44, 45, 47], "sex": [17, 19, 20, 22, 25, 28, 34, 42, 44, 46, 47, 48, 49, 50, 53], "cell_typ": [17, 18, 19, 20, 25, 28, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 46, 47, 48, 49, 50, 51, 53, 54], "assai": [17, 20, 22, 25, 35, 36, 39, 42, 46, 48, 49, 50, 51, 53], "suspension_typ": [17, 20, 25, 28, 31, 34, 37, 42, 46, 48, 49, 50, 53], "diseas": [17, 20, 22, 25, 28, 35, 36, 42, 46, 47, 48, 49, 50, 53], "concat": [17, 18, 25, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53], "tibbl": [17, 25], "frame": [17, 20, 21, 24, 25, 26, 33, 34, 45], "similarli": [17, 19, 25, 34, 45, 50], "gene_filt": [17, 18, 19, 25], "feature_id": [17, 18, 19, 25, 28, 34, 37, 38, 40, 42, 44, 45, 46, 48, 49, 50, 52], "ensg00000107317": [17, 19, 25], "ensg00000106034": [17, 19, 25], "cell_filt": [17, 18, 19, 25], "leptomening": 17, "cell_column": [17, 19, 25], "seurat_obj": [17, 19, 25], "get_seurat": [17, 19, 25], "sce_obj": [17, 19, 25], "get_single_cell_experi": [17, 19, 25], "sometim": 17, "too": 17, "overview": [17, 26, 51], "septemb": 18, "18": [18, 34, 35, 37, 38, 40, 42, 48, 53], "thrill": 18, "offici": [18, 28], "wide": [18, 20, 24, 33, 36, 45], "algorithm": [18, 36, 52, 53], "line": [18, 28, 34, 38, 40, 54], "code": [18, 19, 31, 44, 49, 51, 54], "task": [18, 21, 36], "ten": 18, "convent": [18, 29, 34], "laptop": 18, "8gb": 18, "below": [18, 19, 25, 28, 29, 30, 34, 37, 38, 42, 45, 51, 54], "full": [18, 20, 24, 26, 29, 30, 31, 32, 33, 35, 36, 42, 50, 51, 54], "correct": [18, 22, 54], "These": [18, 19, 21, 24, 27, 28, 31, 33, 34, 36, 37, 38, 40], "interwoven": 18, "seamlessli": 18, "appli": [18, 36, 39, 40], "33m": [18, 21], "continu": [18, 25], "cellxgene_censu": [18, 19, 20, 22, 25, 31, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 49, 50, 51, 52, 53, 54, 55, 56], "pp": [18, 35, 36, 37, 38, 39, 40, 42, 48, 52, 53], "mean_vari": [18, 53], "small": [18, 19, 30, 34, 36, 37, 39, 41, 44, 49, 50], "advantag": [18, 42, 48], "cpu": [18, 35, 38, 54], "multiprocess": 18, "popul": 18, "futur": [18, 22, 25, 27, 34, 35, 37, 38, 39, 41, 44, 45, 46, 47, 49, 50, 51, 52, 53, 54], "we": [18, 19, 21, 24, 25, 27, 31, 33, 34, 35, 36, 37, 38, 39, 40, 42, 43, 44, 45, 47, 48, 49, 50, 53, 54], "enabl": [18, 21, 22, 28, 49], "easili": [18, 19, 21, 39, 42], "switch": [18, 49], "import": [18, 19, 20, 22, 25, 30, 31, 34, 35, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 56], "human_data": 18, "feature_nam": [18, 25, 28, 34, 36, 37, 42, 43, 44, 45, 46, 47, 48, 49, 50, 52], "mean_variance_df": 18, "gene_df": 18, "to_panda": [18, 25, 34, 35, 36, 37, 39, 41, 42, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53], "8624": 18, "071926": 18, "5741": 18, "242485": 18, "16437": 18, "233282": 18, "452": 18, "119153": 18, "feature_length": [18, 25, 28, 34, 35, 37, 39, 42, 44, 45, 46, 48, 49, 50, 52], "ensg00000171885": 18, "5943": 18, "ensg00000133703": 18, "6845": 18, "get_highly_variable_gen": 18, "while": [18, 25, 34, 36, 38, 42, 48, 52], "account": [18, 35, 54], "effect": [18, 19, 35, 36, 48], "integr": [18, 21, 24, 31, 33, 36, 37], "particular": [18, 36, 54], "design": [18, 49], "same": [18, 19, 25, 26, 36, 38, 39, 42, 46, 47, 48, 50, 52], "paradigm": [18, 24, 33], "abov": [18, 21, 25, 26, 28, 34, 38, 47, 49, 50, 51], "tweak": 18, "compli": 18, "rule": 18, "thumb": 18, "good": [18, 36, 39, 48], "variances_norm": [18, 52], "003692": 18, "004627": 18, "748221": 18, "003084": 18, "003203": 18, "898657": 18, "014962": 18, "037395": 18, "513473": 18, "218865": 18, "547648": 18, "786928": 18, "002142": 18, "002242": 18, "894955": 18, "60659": [18, 37, 45], "000000": [18, 36, 44, 52], "60660": [18, 37, 45], "60661": [18, 37, 45], "60662": [18, 37, 45], "60663": [18, 37, 45], "octob": 19, "maximilian": 19, "lombardo": 19, "happi": 19, "introduct": 19, "tailor": 19, "empow": 19, "express": [19, 21, 28, 35, 36, 40, 42, 44, 48], "reflect": [19, 28, 36], "expand": [19, 36, 44], "exclus": [19, 28], "thei": [19, 28, 29, 35, 36, 42, 44, 45, 47, 48], "invit": 19, "feedback": 19, "explor": [19, 21, 24, 31, 32, 33], "novel": [19, 37], "were": [19, 21, 26, 28, 34, 35, 36, 37, 39, 45, 47, 48], "mous": [19, 26, 28, 31, 34, 39, 44, 46, 47, 50, 52, 53], "divid": [19, 44, 47], "sum": [19, 28, 36, 37, 38, 40, 41, 44, 46, 54], "point": [19, 26, 29, 36, 44], "precis": [19, 42, 48], "round": 19, "sigma": 19, "artifact": [19, 27, 28, 36], "m": [19, 23, 26, 34, 37, 38, 39, 40, 45, 50, 52, 56], "enrich": 19, "field": [19, 27, 28, 48, 57], "n_measured_ob": [19, 28, 42, 48], "wa": [19, 28, 36, 39, 40, 45, 46, 48, 49, 54], "augment": 19, "forego": 19, "common": [19, 25, 36, 41, 48, 50, 52, 54], "earli": 19, "raw_sum": [19, 28, 42, 44, 48], "deriv": [19, 38, 39, 48], "raw_mean_nnz": [19, 28, 42, 48], "averag": 19, "raw_variance_nnz": [19, 28, 42, 48], "n_measured_var": [19, 28, 42, 48], "thu": [19, 21, 24, 28, 31, 33, 35, 38, 41, 42, 50], "ensg00000161798": [19, 25, 50], "ensg00000188229": [19, 25, 50], "sympathet": [19, 25], "singlecellexperi": [19, 23, 24, 30, 33], "outlin": 19, "like": [19, 21, 27, 30, 34, 36, 37, 38, 41, 42, 48, 54], "male": [19, 25, 37, 38, 44, 49, 50, 51, 53], "pyarrow": [19, 21, 24, 25, 33, 44, 47], "raw_slic": [19, 25], "equival": [19, 42, 44, 48], "somaaxisqueri": [19, 25], "read_next": [19, 25], "print": [19, 25, 36, 41, 43, 45, 46, 47, 49, 54, 56], "encourag": [19, 24, 33], "engag": 19, "share": [19, 21, 24, 33], "input": [19, 44, 50, 54], "invalu": 19, "ongo": 19, "project": [19, 23, 32, 36], "reach": [19, 24, 33, 35], "report": [19, 22, 36, 49], "repositori": [19, 21, 24, 28, 33, 48, 56], "amazon": [20, 21], "web": [20, 21], "servic": [20, 21, 27], "describ": [20, 26, 28, 29, 31, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 50, 51, 52, 53], "what": [20, 27, 28, 31, 34, 35, 36, 37, 47, 50], "inclus": [20, 28, 41], "criteria": [20, 21, 25, 26, 28, 50], "individu": [20, 24, 28, 33, 34, 35, 39, 47], "root": [20, 28, 29, 56], "definit": [20, 35, 50], "publicli": [20, 21, 22, 24, 29, 33, 57], "uniqu": [20, 21, 22, 28, 34, 35, 36, 37, 41, 44, 47], "05": [20, 29, 30, 47, 49, 54], "bulk": 20, "07": [20, 25, 27, 29, 34, 35, 37, 39, 41, 44, 45, 46, 49, 50, 51, 52, 53, 54], "25": [20, 25, 27, 34, 35, 36, 37, 38, 39, 41, 44, 45, 46, 49, 50, 51, 52, 53, 54], "shell": [20, 38, 40, 46], "sync": [20, 38, 40], "sign": [20, 36], "recommend": [20, 21, 23, 25, 28, 29, 35, 36, 38, 40, 47, 49, 56, 57], "folder": [20, 29, 30, 31, 40], "interact": [20, 24, 33], "document": [20, 21, 25, 28, 29, 31, 34, 35, 39, 41, 48, 50, 57], "last": [21, 22, 28, 29], "jan": 21, "2024": [21, 24, 33, 43], "latenc": [21, 24, 33], "acceler": [21, 24, 33], "50m": 21, "mice": 21, "harmon": [21, 24, 30, 33], "label": [21, 28, 29, 34, 36, 37, 38, 40, 43, 47, 49, 51, 54], "multi": [21, 26, 32, 37, 48], "core": [21, 32, 35, 44], "k": [21, 36], "onlin": [21, 22, 24, 29, 33, 53, 57], "t": [21, 35, 37, 38, 39, 40, 41, 43, 46, 47, 50, 51], "covid": [21, 34, 37, 47, 50], "19": [21, 22, 34, 35, 37, 38, 40, 41, 42, 45, 47, 48, 50], "suit": 21, "author": [21, 28], "spatial": [21, 26, 28, 35, 36, 37, 45, 46], "yet": [21, 23], "d": [21, 42, 48, 56], "click": [21, 25], "indic": [21, 26, 28, 31, 34, 36, 37, 39, 44, 45, 48, 50], "citat": [21, 24, 28, 32, 33], "guidelin": [21, 24, 33], "offer": [21, 24, 33, 36, 42, 48, 57], "becaus": [21, 35, 37, 39, 47], "therefor": [21, 35, 39, 41, 47, 48], "numer": [21, 36], "incompat": [21, 28], "purpos": 21, "suggest": [21, 36], "fast": 21, "corpu": 21, "60": [21, 38, 47], "gencod": 21, "readi": [21, 38, 54], "cloud": [21, 23, 24, 27, 33, 46, 57], "matric": [21, 24, 25, 26, 33, 34, 36, 44], "possibl": [21, 28, 31, 38, 50], "due": [21, 34, 36, 44, 54], "free": [21, 49], "aw": [21, 23, 27, 38, 40, 46, 56], "ye": 21, "download_source_h5ad": [21, 46], "help": [21, 25, 31, 34, 39, 41, 48, 49, 50, 52, 54], "pattern": [21, 36, 42], "internet": [21, 23, 49], "limit": [21, 34, 47], "bandwidth": [21, 47, 56], "tactic": 21, "connect": [21, 23, 37, 38, 49, 51, 56], "high": [21, 26, 28, 34, 36, 37, 38, 47, 49, 52, 56], "ethernet": 21, "wifi": 21, "coast": 21, "ec2": [21, 23], "instanc": [21, 23, 28, 36, 41, 49, 56], "There": [21, 23, 37, 38, 41, 42, 45, 47, 48, 52], "howev": [21, 35, 36, 37, 54], "environ": [21, 23], "census_env": 21, "activ": [21, 23, 25, 48, 56], "submit": [21, 24, 33], "join": [21, 24, 33, 34, 37, 44, 46, 50, 52], "scienc": [21, 24, 33, 43, 45, 55], "commun": [21, 24, 33, 36, 42, 48], "slack": [21, 24, 30, 33], "co": [21, 24, 33], "question": [21, 34], "channel": [21, 24, 30, 33], "inquir": 21, "accept": [21, 52], "meet": [21, 25, 50, 52], "biolog": [21, 32, 47, 48, 54], "try": [21, 54], "old": [21, 37, 53], "persist": [21, 26], "notebook": [21, 23, 30, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 48, 49, 54, 56], "sh": [21, 23], "restart": 21, "runtim": 21, "reload": [21, 38], "numba": [21, 44], "relat": [21, 29], "magic": 21, "similar": [21, 34, 35, 36, 37, 40, 50, 51, 52], "dbutil": 21, "restartpython": 21, "addition": [21, 35, 36], "node": [21, 34], "cluster": [21, 32, 35, 40], "0d53f00001ghvp3cap": 21, "between": [21, 28, 36, 38], "altern": [21, 54], "ad": [21, 28, 30, 36, 48, 49, 50], "tab": 21, "edit": [22, 28, 29], "decemb": [22, 28], "15th": [22, 24, 33], "stabil": 22, "scientif": 22, "reproduc": [22, 35, 49, 51], "plan": [22, 24, 33], "regular": 22, "everi": [22, 24, 33], "six": [22, 24, 33], "month": [22, 24, 29, 30, 33, 53], "least": [22, 24, 28, 33], "year": [22, 24, 29, 30, 33, 37], "recogn": 22, "previou": [22, 27, 35, 37, 42, 48], "ingest": [22, 47], "hand": 22, "week": [22, 50], "651": 22, "62": [22, 37, 38, 40, 47], "998": 22, "417": 22, "684": 22, "805": 22, "36": [22, 34, 38, 54], "227": [22, 52], "903": 22, "230": 22, "588": [22, 37, 45, 46], "990": 22, "categori": [22, 28, 34, 37, 38, 51], "20": [22, 34, 35, 37, 38, 40, 43, 45, 48, 53, 56], "631": 22, "248": [22, 34, 41], "stage": [22, 37, 49, 50, 53], "173": [22, 52], "72": [22, 38], "self": [22, 30, 31, 35, 44, 49, 54], "ethnic": [22, 49], "na": [22, 28, 34, 51, 53], "suspens": [22, 35, 49], "74": [22, 38], "53": [22, 38], "27": [22, 34, 35, 37, 38, 45, 54], "scvi": [22, 31, 32, 36, 56], "fine": [22, 42, 56], "geneform": [22, 32, 36], "593": [22, 37, 45, 46], "56": [22, 37, 38], "400": 22, "873": 22, "255": 22, "245": [22, 45], "33": [22, 37, 38, 48, 54], "364": 22, "242": 22, "083": 22, "531": [22, 37], "13": [22, 34, 35, 37, 38, 39, 42, 47, 48], "035": 22, "613": [22, 34, 41, 51], "164": 22, "64": [22, 34, 38], "26": [22, 34, 35, 37, 38, 45, 54], "220": [22, 34, 41, 45], "66": [22, 34, 38, 41], "54": [22, 34, 38], "prevent": [22, 48], "analys": [22, 49], "mark": [22, 28, 34, 36, 47], "is_primari": 22, "exactli": [22, 28], "243": [22, 34, 45], "569": 22, "twice": [22, 34], "wish": [22, 34, 52], "consid": [22, 35], "duplicate_cells_census_lts_2023": 22, "csv": [22, 49], "zip": [22, 40, 44], "562": 22, "794": 22, "728": 22, "086": 22, "032": 22, "758": 22, "887": 22, "914": 22, "318": 22, "493": 22, "362": 22, "604": 22, "226": 22, "68": [22, 38], "51": [22, 37, 38], "61": [22, 38], "linux": [23, 56], "maco": [23, 56], "system": [23, 34, 36, 42, 46, 48, 56], "Or": 23, "tbd": 23, "16": [23, 34, 35, 37, 38, 39, 40, 42, 48, 49, 53, 54], "gb": [23, 49], "mbp": [23, 49], "increas": [23, 24, 33, 49], "virtual": [23, 56], "conda": 23, "venv": [23, 35, 37, 39, 56], "bin": [23, 56], "modul": [23, 31, 32, 35, 54], "less": [23, 36, 54], "complex": [23, 34, 36, 41, 44, 45], "databrick": 23, "faq": [23, 24, 33], "ubuntu": [23, 56], "apt": 23, "libxml2": 23, "dev": 23, "libssl": 23, "libcurl4": 23, "openssl": 23, "cmake": 23, "21": [23, 35, 37, 38, 39, 40, 45, 47, 50, 53], "greater": [23, 28, 43], "tool": [23, 31, 36, 40, 49, 56], "xcode": 23, "window": [23, 54], "univers": [23, 36, 48], "cran": 23, "abl": [23, 27], "export": [23, 30, 42, 57], "biocmanag": 23, "quietli": 23, "ve": [24, 33], "central": [24, 33, 42, 48], "hub": [24, 33], "embed": [24, 33, 35, 40], "analyz": [24, 33], "significantli": [24, 33], "minim": [24, 33, 36], "studi": [24, 33, 35, 36], "scale": [24, 33, 35, 37, 38, 39], "interoper": [24, 33, 49], "toolkit": [24, 32, 33], "smart": [24, 26, 28, 31, 33, 34, 37, 45, 46, 51, 53], "seq2": [24, 26, 28, 31, 33, 34, 37, 39, 45, 46, 51, 53], "molecul": [24, 26, 33], "10x": [24, 25, 26, 28, 31, 33, 34, 36, 37, 40, 45, 46, 47, 49, 50, 53], "duplic": [24, 26, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 48, 50, 51], "five": [24, 33], "without": [24, 28, 29, 33, 36, 54], "perman": [24, 33], "ask": [24, 33], "email": [24, 30, 33, 48], "believ": [24, 33], "secur": [24, 33], "disclos": [24, 33], "contact": [24, 33], "seamless": [24, 33], "pytorch": [24, 32, 33], "usabl": [24, 33, 54], "area": [24, 33], "On": [24, 33], "demand": [24, 25, 33], "rich": [24, 33, 35], "subsampl": [24, 33], "vignett": [25, 40], "soon": 25, "remind": [25, 42, 45, 48], "etc": [25, 26, 31, 34], "output": [25, 44, 54], "consist": [25, 31, 34, 35, 36, 37, 39, 41, 44, 45, 46, 47, 49, 50, 51, 52, 53, 54], "ey": [25, 45], "379219": 25, "microwel": [25, 28, 34, 37, 50], "seq": [25, 28, 34, 35, 37, 50, 51], "adren": [25, 34], "gland": [25, 34, 38, 47, 48, 51], "379220": 25, "379221": 25, "379222": 25, "379223": 25, "379224": 25, "7": [25, 34, 35, 36, 37, 38, 39, 40, 42, 45, 46, 47, 48, 49, 50, 54], "n_var": [25, 37, 39, 42, 44, 45, 46, 48, 49, 50], "demonstr": [25, 31, 32, 34, 35, 36, 40, 42, 43, 44, 46, 48, 49, 52, 54], "initi": [25, 28, 40, 42, 47, 48], "lazi": [25, 42, 47, 48], "evalu": 25, "well": [25, 28, 34, 35, 37, 47, 51], "logic": [25, 37], "wrap": [25, 44, 54], "loop": 25, "r6": 25, "familiar": [25, 28, 35, 37, 39, 54, 57], "379": 25, "224": 25, "chr": 25, "fema": 25, "6": [25, 27, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50, 51, 54], "\u2139": 25, "214": 25, "smaller": [25, 54], "4k": 25, "4744": 25, "sampl": [25, 37, 38, 40, 44], "bioconductor": 25, "ecosystem": 25, "dim": 25, "rownam": 25, "rowdata": 25, "colnam": 25, "obs48350835": 25, "obs48351829": 25, "obs52469564": 25, "obs52470190": 25, "coldata": 25, "reduceddimnam": 25, "mainexpnam": 25, "altexpnam": 25, "sparse_matrix": 25, "state": [25, 36, 37, 45, 46], "monitor": 25, "read_complet": 25, "friendli": 26, "varieti": [26, 36, 41, 44, 48], "hierarchi": 26, "somacollect": [26, 34, 41, 56], "item": [26, 34, 41, 46, 54], "whole": [26, 28, 34, 37], "summary_cell_count": [26, 34, 37, 51], "stratifi": [26, 34, 38], "relev": [26, 28, 32, 34, 50], "independ": [26, 34], "somaexperi": [26, 34, 44], "special": [26, 28, 34, 50], "form": [26, 34, 45, 54], "how": [26, 31, 32, 34, 36, 37, 39, 42, 43, 47, 48, 51, 54], "avialbl": 26, "feature_dataset_presence_matrix": [26, 37, 39], "boolean": [26, 28, 37, 39, 45], "adher": 26, "technologi": [26, 28, 31, 34, 35, 37, 39], "short": [26, 30, 34], "densendarrai": 26, "dimension": [26, 28, 36, 37], "offset": 26, "sparsendarrai": [26, 42, 48], "primari": [26, 28, 31, 36, 38, 51], "observ": [26, 28, 35, 44, 47, 49, 51], "varm": 26, "geograph": 27, "json": [27, 36, 38, 40, 48], "cziscienc": [27, 38, 40, 43, 48, 49], "base_uri": 27, "three": [27, 49, 50], "gc": [27, 40], "rememb": [27, 34, 47], "relative_uri": 27, "hood": 27, "cloudfront": 27, "registri": 27, "resolv": 27, "against": 27, "onward": 27, "togeth": [27, 54], "could": [27, 36, 40, 54], "word": [28, 29, 31, 36, 44, 45, 48], "NOT": [28, 29, 44, 45], "shall": [28, 29], "interpret": [28, 29, 36], "bcp": [28, 29], "14": [28, 29, 34, 35, 37, 38, 39, 42, 45, 48], "rfc2119": [28, 29], "rfc8174": [28, 29], "capit": [28, 29], "hereaft": 28, "visit": [28, 36, 55], "understand": [28, 31, 32, 36], "reader": [28, 31, 42], "throughout": [28, 38, 40, 47, 48], "serv": [28, 39], "deposit": [28, 29, 31], "heart": [28, 45, 47, 52], "left": [28, 30, 31, 35, 37], "ventricl": [28, 41], "semver": 28, "major": [28, 37], "delet": 28, "modal": 28, "minor": 28, "compat": 28, "patch": 28, "editori": 28, "separ": [28, 36, 47, 49, 52], "impos": 28, "organism_ontology_term_id": 28, "ncbitaxon": 28, "10090": 28, "9606": 28, "feature_refer": 28, "show": [28, 31, 32, 34, 36, 38, 39, 44, 47, 54], "AND": 28, "assay_ontology_term_id": [28, 31, 34, 37, 41, 42, 46, 48, 49, 50, 53], "id": [28, 34, 35, 36, 38, 39, 40, 44, 48, 49], "efo": [28, 34, 35, 37, 50, 51, 53], "0030003": [28, 34, 37], "transcript": [28, 34, 37], "profil": [28, 34, 37], "0009901": [28, 34], "0009899": [28, 34, 37, 53], "0009922": [28, 34, 50], "0030004": [28, 34], "0011025": [28, 34], "0009900": [28, 34], "0700004": [28, 34], "bd": [28, 34, 37], "rhapsodi": [28, 34, 37], "target": [28, 34], "mrna": [28, 34], "0700003": [28, 34], "transcriptom": [28, 34, 35, 37, 39, 45, 46, 47], "0010010": [28, 34], "cel": [28, 34], "0008720": 28, "dronc": 28, "0008722": [28, 34, 37, 51], "drop": [28, 34, 37, 38, 44, 51], "0700011": 28, "gexscop": 28, "0008780": [28, 34, 51], "indrop": [28, 34, 37, 51], "0008796": 28, "mar": 28, "0030002": [28, 34, 50], "0010550": [28, 34], "sci": [28, 34, 37], "0008919": [28, 34, 51], "0030019": 28, "0008930": 28, "0700016": 28, "v4": 28, "0008931": [28, 34, 51, 53], "0008953": [28, 34], "strt": [28, 34], "0700010": 28, "trudrop": 28, "ration": 28, "0030059": 28, "multiom": [28, 37, 45, 46], "atac": 28, "0030007": 28, "scatac": 28, "0008992": 28, "merfish": 28, "0008853": 28, "certainti": 28, "0010891": 28, "0030026": 28, "plex": 28, "lack": [28, 36], "proper": [28, 31, 35], "0030062": 28, "slide": 28, "seqv2": 28, "0030027": 28, "snmc": 28, "0010961": 28, "visium": 28, "umi": 28, "tissue_ontology_term_id": [28, 34, 37, 41, 42, 46, 48, 49, 50, 53], "ontology_term_id": [28, 34, 37, 51], "organoid": 28, "referenc": [28, 37], "whose": [28, 37, 50], "readabl": [28, 29, 31, 37], "census_schema_vers": [28, 34, 43], "census_build_d": [28, 34, 43], "iso": [28, 29, 48], "8601": [28, 29], "dataset_schema_vers": [28, 34, 43], "total_cell_count": [28, 34, 37, 43, 51], "unique_cell_count": [28, 34, 37, 43, 51], "number_donors_homo_sapien": [28, 34, 43], "number_donors_mus_musculu": [28, 34, 43], "10000": [28, 36], "100": [28, 34, 35, 37], "collection_id": [28, 35, 39, 45, 46], "quot": 28, "collection_nam": [28, 31, 35, 37, 39, 45, 46], "collection_doi": [28, 35, 39, 45, 46], "dataset_titl": [28, 31, 35, 37, 39, 45, 46], "dataset_h5ad_path": [28, 35, 39, 45, 46], "rel": [28, 39, 53], "storag": [28, 57], "dataset_total_cell_count": [28, 35, 39, 45, 46], "dataset_version_id": 28, "self_reported_ethn": [28, 34, 37, 42, 46, 48, 49, 50], "0002048": [28, 37, 41], "cell_type_a": 28, "xxxxx": 28, "cell_type_n": 28, "assay_a": 28, "assay_n": 28, "tissue_a": 28, "tissue_n": 28, "tissue_general_a": 28, "tissue_general_n": 28, "disease_a": 28, "mondo": [28, 37], "disease_n": 28, "self_reported_ethnicity_a": 28, "hancestro": [28, 50], "self_reported_ethnicity_n": 28, "sex_a": 28, "pato": [28, 37, 50, 53], "sex_n": 28, "suspension_type_a": 28, "suspension_type_n": 28, "somameasur": 28, "somaindexeddatafram": 28, "float32": [28, 39, 42, 44, 48], "fill": [28, 48], "variant": 28, "feature_biotyp": 28, "pin": 28, "clarifi": 28, "feature_1": 28, "feature_m": 28, "dataset_soma_joinid_1": 28, "dataset_soma_joinid_n": 28, "tissue_general_ontology_term_id": [28, 34, 37, 42, 46, 48, 49, 50, 53], "cell_type_ontology_term_id": [28, 34, 37, 41, 42, 46, 48, 49, 50, 51, 53], "development_stage_ontology_term_id": [28, 34, 37, 42, 46, 48, 49, 50, 53], "development_stag": [28, 34, 37, 42, 46, 48, 49, 50, 53], "disease_ontology_term_id": [28, 34, 37, 42, 46, 48, 49, 50, 53], "observation_joinid": 28, "self_reported_ethnicity_ontology_term_id": [28, 34, 37, 42, 46, 48, 49, 50, 53], "sex_ontology_term_id": [28, 34, 37, 42, 46, 48, 49, 50, 53], "tissue_typ": 28, "text": [28, 29, 30, 31], "cell_census_build_d": 28, "cell_census_schema_vers": 28, "renam": [28, 37], "move": [28, 54], "varp": [28, 45], "dataset_presence_matrix": 28, "ascii": [28, 29], "0x22": 28, "exclam": 29, "intern": 29, "Its": 29, "notic": [29, 49], "april": 29, "printabl": 29, "charact": 29, "record": [29, 41], "machin": [29, 38], "parent": [29, 34], "longer": [29, 35], "dai": 29, "info_permalink": 29, "later": [29, 36, 38, 40, 42, 48], "release_alia": 29, "release_nam": 29, "null": 29, "url": [29, 38, 40], "blog": 30, "piec": [30, 34], "intend": [30, 52, 54], "deliv": 30, "hous": 30, "blurb": 30, "extern": 30, "goal": [30, 31, 34, 35, 39, 44], "master": 30, "link": [30, 37, 45, 46], "twitter": 30, "One": [30, 36], "stop": [30, 35, 47], "place": [30, 31, 35, 54], "histor": 30, "view": [30, 31, 37, 49, 52], "great": [30, 35, 39], "approach": [30, 36], "apach": 30, "subdirectori": 30, "markdown": [30, 31], "md": [30, 31], "prefix": 30, "yyyymmdd": 30, "discret": [30, 31, 35], "20230810": 30, "r_api_is_out": 30, "highest": [30, 31], "header": [30, 31], "concis": [30, 31], "explanatori": [30, 31], "white_check_mark": [30, 31], "cool": 30, "error": [30, 34, 38, 41], "ital": 30, "keyboard": 30, "john": 30, "smith": 30, "author1": 30, "phil": 30, "scoot": 30, "author2": 30, "introductori": [30, 31], "paragraph": [30, 31], "right": [30, 31, 37, 47], "underneath": [30, 31], "summari": [30, 31, 32, 43], "30m": 30, "rest": [30, 31, 37], "render": [30, 31], "sidebar": [30, 31], "absenc": [30, 31], "sub": [30, 31, 49], "writer": [30, 31], "pgarcia": 30, "capabitli": 30, "part": [31, 35, 36], "cellcensu": 31, "symlink": 31, "asset": 31, "face": 31, "onboard": 31, "product": 31, "unless": 31, "direct": [31, 46], "mention": 31, "action": 31, "extract": [31, 44, 54], "length": [31, 32, 34, 37, 38, 43], "exhaust": [31, 35], "showcas": [31, 34, 35, 44, 47, 48, 50], "clear": [31, 34, 36, 47], "power": 31, "bold": 31, "lower": [31, 37, 52, 54], "qc": 31, "much": [31, 36, 41], "equal": [31, 41, 42], "kept": 31, "succinct": 31, "liver": [31, 39, 47], "inspect": [31, 42, 48, 54], "prior": 31, "blob": [31, 49], "cellxgene_census_schema": 31, "repeat": [31, 47], "let": [31, 34, 35, 36, 37, 38, 39, 40, 42, 45, 46, 47, 48, 49, 50], "sc": [31, 35, 36, 37, 38, 39, 40, 49], "np": [31, 35, 36, 37, 38, 39, 40, 44, 45, 48], "tabula": [31, 35, 37, 39, 45, 46], "muri": [31, 35, 39, 46], "seni": [31, 35, 39, 46], "genom": [31, 49], "stream": [32, 57], "gget": 32, "collabor": [32, 36, 38], "predict": [32, 36], "biologi": [32, 48], "gain": 32, "natur": [32, 37, 38, 47, 49], "pipelin": 32, "summar": [32, 34, 37, 51], "leverag": 32, "cover": 34, "simpl": [34, 36, 40, 44, 49, 54], "sever": [34, 41, 42], "handl": [34, 41, 42, 43, 47, 54], "34": [34, 35, 37, 38, 39, 40, 41, 44, 45, 46, 47, 49, 50, 51, 52, 53, 54], "39": [34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54], "think": [34, 40], "variou": [34, 36, 41, 51], "analog": 34, "census_info": [34, 35, 37, 39, 43, 45, 46, 51], "census_obj": 34, "want": [34, 44, 47, 50, 54, 56], "pair": [34, 44], "61656118": [34, 41, 46], "37447773": 34, "13035": 34, "1417": 34, "Of": 34, "meta": [34, 47, 49], "consortia": 34, "idea": 34, "Not": 34, "cast": 34, "census_count": 34, "33364242": [34, 51], "56400873": [34, 46, 51], "264166": [34, 51], "279635": [34, 51], "25652": [34, 37, 51], "51304": [34, 51], "89477": [34, 51], "206754": [34, 51], "78750": [34, 51], "188248": [34, 51], "1357": [34, 51], "0002113": [34, 51], "179684": [34, 51], "208324": [34, 51], "kidnei": [34, 38, 45, 47, 51], "1358": [34, 51], "0002365": [34, 51], "15577": [34, 51], "31154": [34, 51], "exocrin": [34, 38, 48, 51], "1359": [34, 51], "0002367": [34, 51], "37715": [34, 51], "130135": [34, 51], "prostat": [34, 51], "1360": [34, 51], "0002368": [34, 51], "13322": [34, 51], "26644": [34, 51], "endocrin": [34, 38, 51], "1361": [34, 51], "0002371": [34, 51], "90225": [34, 51], "144962": [34, 51], "bone": [34, 38, 46, 47, 51], "marrow": [34, 46, 47, 51], "1362": [34, 51], "omit": 34, "creation": 34, "value_count": [34, 35, 37, 39, 41, 44, 47, 50], "sort": 34, "census_human_assai": 34, "sort_valu": [34, 38], "ascend": 34, "11845077": 34, "25597563": 34, "7559102": 34, "12638794": 34, "3872375": 34, "6139786": 34, "4062980": 34, "5064268": 34, "2930054": 34, "3139770": 34, "17": [34, 35, 37, 38, 39, 40, 42, 48, 49, 53], "915037": 34, "1084235": 34, "744798": 34, "811422": 34, "625175": 34, "642559": 34, "146278": 34, "177276": 34, "42397": 34, "121394": 34, "0010183": 34, "58981": [34, 37], "117962": 34, "96145": 34, "0008995": 34, "29128": 34, "4693": 34, "9386": 34, "3105": 34, "5244": 34, "69": [34, 38], "0000129": 34, "268114": 34, "370771": 34, "1038": [34, 35, 39, 43, 45, 46], "48998": 34, "62617": 34, "easi": [34, 44, 48], "fall": [34, 35], "certain": [34, 36, 54], "distribut": [34, 35, 43], "answer": 34, "exemplifi": 34, "stat": 34, "trivial": 34, "human_cell_typ": 34, "syncytiotrophoblast": [34, 50], "placent": [34, 50], "villou": [34, 50], "trophoblast": [34, 37, 38, 45, 46, 50], "extravil": [34, 50], "56400868": [34, 37], "pericyt": [34, 37, 38, 54], "56400869": [34, 37], "56400870": [34, 37], "56400871": [34, 37], "56400872": [34, 37], "focu": [34, 35, 36, 39], "de": 34, "shape": [34, 36, 37, 42, 44, 47, 48, 54], "human_cell_type_count": 34, "2673669": 34, "glutamaterg": [34, 38], "1541605": 34, "cd4": [34, 37, 38, 40], "alpha": [34, 37, 38], "1258976": 34, "cd8": [34, 37, 38, 40], "1235987": 34, "classic": [34, 37], "monocyt": [34, 37, 38, 40], "1030996": 34, "microfold": 34, "epithelium": 34, "intestin": [34, 38, 47], "dendrit": [34, 38, 40], "serou": 34, "bronchu": 34, "sperm": [34, 51], "enteroendocrin": 34, "599": 34, "abund": [34, 37], "That": 34, "achiev": [34, 48], "human_liver_cell_typ": 34, "85739": 34, "hepatoblast": 34, "58447": 34, "neoplast": [34, 38], "52431": 34, "erythroblast": 34, "45605": 34, "31388": 34, "pulmonari": [34, 37, 49, 50], "arteri": 34, "endotheli": [34, 37, 38, 45, 47, 54], "germin": 34, "center": 34, "b": [34, 37, 38, 40, 50], "pneumocyt": [34, 37], "innat": 34, "lymphoid": 34, "126": [34, 54], "go": 34, "sake": [34, 37, 44], "t_cells_list": 34, "t_cells_diseas": 34, "f": [34, 35, 36, 37, 38, 39, 40, 41, 45, 46, 47, 53, 54], "hodgkin": 34, "lymphoma": 34, "blood": [34, 45, 47, 49, 50], "62499": 34, "819428": 34, "30578": 34, "nose": 34, "respiratori": [34, 37, 51], "saliva": 34, "41": [34, 38], "crohn": 34, "colon": 34, "17490": 34, "52029": 34, "down": 34, "syndrom": 34, "181": 34, "breast": 34, "cancer": [34, 37], "1850": 34, "chronic": [34, 37, 50], "obstruct": [34, 37, 50], "9382": 34, "rhiniti": 34, "909": 34, "renal": [34, 37, 45, 46], "carcinoma": [34, 37, 50], "6548": 34, "20540": 34, "lymph": 34, "cystic": [34, 37], "fibrosi": [34, 37, 50], "follicular": 34, "1089": 34, "influenza": 34, "8871": 34, "interstiti": [34, 37, 38, 49, 50], "1803": 34, "benign": 34, "neoplasm": 34, "oncocytoma": 34, "2408": 34, "adenocarcinoma": [34, 37, 50], "205": 34, "3274": 34, "507": 34, "215013": 34, "24969": 34, "pleural": 34, "fluid": 34, "11558": 34, "5922": 34, "lymphangioleiomyomatosi": [34, 37, 50], "513": 34, "36573": 34, "nonpapillari": 34, "adipos": [34, 47], "4828": 34, "288": [34, 45], "clot": 34, "1717": 34, "69136": 34, "pleomorph": [34, 37, 50], "1715": 34, "pneumonia": [34, 37, 50], "856": [34, 44], "1671": 34, "disord": 34, "34301": 34, "squamou": [34, 37, 38, 50], "52053": 34, "lupu": 34, "erythematosu": 34, "355471": 34, "don": [34, 39, 41, 43, 47, 50], "forget": [34, 39, 41, 43, 50], "del": [34, 35, 36, 37], "opportun": 35, "inter": 35, "ignor": [35, 36, 37, 38, 39, 40, 42, 44, 48], "home": [35, 37, 39], "ssm": [35, 37, 39], "lib": [35, 37, 39], "python3": [35, 37, 39], "_set": 35, "63": [35, 38], "userwarn": [35, 37, 39], "70": [35, 38], "dl_pin_memory_gpu_train": 35, "pin_memori": 35, "loader": 35, "tqdm": [35, 37, 39], "auto": [35, 37, 39], "tqdmwarn": [35, 37, 39], "iprogress": [35, 37, 39], "jupyt": [35, 37, 39, 56], "ipywidget": [35, 37, 39], "user_instal": [35, 37, 39], "autonotebook": [35, 37, 39], "notebook_tqdm": [35, 37, 39], "census_dataset": [35, 37, 45, 46], "tabula_liv": 35, "loc": [35, 45], "525": [35, 39], "0b9d8a04": [35, 39, 46], "bb9d": [35, 39, 46], "44da": [35, 39, 46], "aa27": [35, 39, 46], "705bb65b54eb": [35, 39, 46], "s41586": [35, 39, 43, 45, 46], "020": [35, 39, 45, 46], "2496": [35, 39, 46], "4546e757": [35, 39], "34d0": [35, 39], "4d17": [35, 39], "be06": [35, 39], "538318925fcd": [35, 39], "atla": [35, 37, 39, 45, 46, 47], "cha": [35, 39], "2859": [35, 39], "547": 35, "6202a243": [35, 47], "b713": [35, 47], "4e12": [35, 47], "9ced": [35, 47], "c387f8483dea": [35, 47], "7294": [35, 47], "tabula_muris_liver_id": 35, "smart_seq_gene_length": 35, "to_numpi": [35, 36, 37, 38, 39, 44, 48], "smart_seq_index": 35, "smart_seq_x": 35, "proce": [35, 39], "ceil": 35, "put": [35, 48], "omic": [35, 48], "primarili": [35, 36, 37], "yosef": 35, "lab": [35, 37, 45, 46, 48], "uc": [35, 36], "berkelei": 35, "variat": [35, 36], "infer": [35, 54], "deep": 35, "scrna": [35, 37], "comprehens": 35, "best": [35, 36], "practic": [35, 39], "strength": 35, "bread": [35, 37], "butter": [35, 37], "neighbor": [35, 36, 37, 38, 39, 40, 42, 48], "graph": [35, 36], "visual": [35, 36, 37, 38, 40], "umap": [35, 36, 37, 38, 39, 40, 42, 48], "But": [35, 47], "save": [35, 46, 48, 49, 54], "normalize_tot": [35, 36, 37, 38, 39, 40], "target_sum": [35, 36, 37, 38, 39, 40], "1e4": [35, 37, 38, 39, 40], "log1p": [35, 36, 37, 38, 39, 40], "max_valu": [35, 37, 38, 39], "final": [35, 36, 38, 39, 44, 45, 47, 48, 52, 54], "tl": [35, 36, 37, 38, 39, 40, 42, 48], "pca": [35, 37, 38, 39], "n_neighbor": [35, 36, 38, 40], "n_pc": [35, 38], "40": [35, 38], "pl": [35, 36, 37, 38, 39, 40, 42, 48, 49], "color": [35, 36, 37, 38, 39, 40, 42, 48], "plot": [35, 36, 37, 39, 40, 42, 48], "_tool": [35, 37, 39], "scatterplot": [35, 36, 37, 39], "392": [35, 37, 39], "No": [35, 37, 39], "colormap": [35, 37, 39], "cmap": [35, 37, 39], "cax": [35, 37, 39], "scatter": [35, 36, 37, 39, 40, 42, 48], "strong": [35, 37], "properli": 35, "principl": 35, "randomli": [35, 36], "whenev": 35, "evidenc": 35, "articl": 35, "health": 35, "sikkema": 35, "et": [35, 47], "al": [35, 47], "whom": 35, "perfom": 35, "43": [35, 38, 45, 52], "latent": [35, 36, 40], "setup_anndata": 35, "vae": 35, "n_layer": 35, "n_latent": 35, "gene_likelihood": 35, "nb": 35, "n_hidden": 35, "50": [35, 38, 50], "gpu": [35, 38, 40], "tpu": 35, "tf_cpp_min_log_level": 35, "rerun": [35, 36], "info": [35, 37, 40, 49], "max_epoch": 35, "ipu": 35, "hpu": 35, "epoch": [35, 54], "00": [35, 39, 42], "15it": 35, "v_num": 35, "train_loss_step": 35, "545": 35, "train_loss_epoch": 35, "560": 35, "trainer": [35, 38], "17it": 35, "represent": [35, 36, 38], "x_scvi": 35, "get_latent_represent": [35, 40], "use_rep": [35, 36, 38, 40, 42, 48], "mainli": 35, "driven": [35, 36], "albeit": 35, "contribut": [35, 36, 37, 42, 48], "curat": [35, 43, 49], "strongli": 35, "22": [35, 37, 38, 49, 51, 53, 56], "dataset_id_donor_id": 35, "astyp": [35, 36, 38], "23": [35, 37, 38, 45, 49], "24": [35, 37, 38, 45, 53], "27it": 35, "520": 35, "550": 35, "25it": 35, "mostli": [35, 37], "nucleu": [35, 48, 50], "accomplish": [35, 37], "latter": [35, 50], "knowledg": 36, "journei": 36, "2d": [36, 42, 48], "involv": 36, "nonlinear": 36, "transform": [36, 37, 38, 39, 40, 48], "Such": 36, "affect": [36, 54], "manifold": 36, "overclust": 36, "typic": [36, 54], "reduct": [36, 47], "mind": [36, 51], "hypothes": 36, "focus": 36, "ultim": 36, "investig": 36, "behind": 36, "foundat": [36, 48], "emb": [36, 38, 42, 48], "technic": 36, "often": 36, "might": [36, 49], "pure": 36, "systemat": 36, "bias": [36, 37], "factor": 36, "complic": 36, "matter": 36, "techniqu": 36, "nearest": 36, "themselv": 36, "amplifi": [36, 38], "rigor": 36, "benchmark": 36, "fulli": 36, "space": [36, 38], "highlight": 36, "challeng": 36, "unsolv": 36, "problem": 36, "briefli": [36, 49], "illustr": [36, 48], "capac": 36, "captur": 36, "intrigu": 36, "phenomena": 36, "disclaim": 36, "depth": [36, 37, 39], "insight": [36, 48], "glean": 36, "innacur": 36, "leidenalg": 36, "hdbscan": 36, "scikit": [36, 56], "warn": [36, 37, 38, 40, 42, 48], "get_embed": [36, 38, 48], "get_embedding_metadata": [36, 48], "filterwarn": [36, 38, 40, 42, 48], "def": [36, 44, 54], "generate_umaps_from_embed": 36, "emb_nam": [36, 42], "euclidean": 36, "key_ad": 36, "neighbors_kei": 36, "x_emb_nam": 36, "x_": 36, "_": [36, 48], "_umap": 36, "x_umap": 36, "var_nam": [36, 37, 38, 40], "build_anndata_with_embed": 36, "embedding_uri": [36, 48], "embedding_nam": 36, "coord": [36, 48], "experiment_nam": [36, 48, 53], "miss": [36, 40, 44, 48], "nan": [36, 48, 52], "intersect": 36, "accordingli": 36, "filt": 36, "ones": 36, "nan_row_sum": 36, "isnan": [36, 44], "total_column": 36, "embedding_uris_commun": 36, "scgpt": [36, 48], "contrib": [36, 38, 40, 48], "cxg": [36, 48], "embedding_names_censu": 36, "embedding_names_al": 36, "obs_df": [36, 41, 44, 48, 51, 53], "n_subset_cel": 36, "150000": 36, "idx_rand": 36, "choic": [36, 38, 40, 49], "soma_joinids_subset": 36, "tolist": [36, 37, 40, 41], "799353": 36, "distinctli": 36, "oca2": 36, "marker": [36, 40], "kit": 36, "vari": 36, "immatur": 36, "clearli": 36, "slight": 36, "extens": [36, 47], "concentr": 36, "seen": 36, "satellit": 36, "signatur": 36, "probabl": [36, 38, 54], "mani": [36, 44, 54], "disconnect": 36, "compon": 36, "tend": 36, "extent": 36, "versu": 36, "unclear": 36, "qualit": 36, "pronounc": 36, "basi": 36, "geneformer_umap": 36, "use_raw": 36, "scgpt_umap": 36, "uce_umap": 36, "scvi_umap": 36, "subclust": 36, "leiden": [36, 38, 40], "emploi": 36, "densiti": 36, "pairwis": 36, "distanc": [36, 44], "compar": [36, 40], "reveal": [36, 37], "distinct": [36, 54], "signific": [36, 51], "agreement": 36, "mutual": 36, "nmi": 36, "score": 36, "assign": [36, 44], "65": [36, 38], "inher": 36, "expect": [36, 37, 39, 48], "finetun": 36, "subclass": 36, "homogen": [36, 54], "belong": 36, "underscor": 36, "draw": 36, "coupl": 36, "conclus": 36, "lead": 36, "identif": 36, "evid": 36, "examin": [36, 54], "relianc": 36, "unjustifi": 36, "known": 36, "phenomenon": 36, "cross": [36, 37], "fuller": 36, "hold": [36, 54], "necessit": 36, "thereof": 36, "pd": [36, 37, 40, 44, 52, 53, 54], "pdist": 36, "squareform": 36, "sklearn": [36, 40], "normalized_mutual_info_scor": 36, "adata_rbn": 36, "obsp": 36, "_connect": 36, "_leiden": 36, "pairwise_dist": 36, "_hdbscan": 36, "min_cluster_s": 36, "min_sampl": 36, "precomput": [36, 51], "fit_predict": 36, "displai": [36, 40, 41, 44, 48, 49, 54], "embedding_kei": 36, "sim_scores_leiden": 36, "len": [36, 37, 38, 40, 41, 44, 46, 47, 54], "sim_scores_hdbscan": 36, "embedding_i": 36, "enumer": 36, "embedding_j": 36, "sim_scores_leiden_t": 36, "sim_scores_hdbscan_t": 36, "seem": [36, 37], "log": [36, 37, 39, 40], "08115140648299893": 36, "7314893672395334": 36, "33702547333985217": 36, "7730928192948211": 36, "723355": 36, "721222": 36, "677754": 36, "775717": 36, "753719": 36, "822202": 36, "089308": 36, "106379": 36, "073141": 36, "480575": 36, "646415": 36, "356779": 36, "11896761": 36, "th": 36, "wherea": [36, 48], "tendenc": 36, "condit": [36, 50], "glioblastoma": 36, "pilocyt": 36, "astrocytoma": 36, "mix": 36, "outsid": 36, "53d208b0": [36, 37, 45], "2cfd": [36, 37, 45], "4366": [36, 37, 45], "9866": [36, 37, 45], "c3c6114081bc": [36, 37, 45], "smartseq": 36, "cftr": 36, "rare": 36, "recogniz": 36, "coo_matrix": 37, "summary_t": 37, "980": [37, 52], "2907156": 37, "6011592": 37, "lung_ob": 37, "5945423": 37, "9f222629": [37, 49], "9e39": [37, 49], "47d0": [37, 49], "b83f": [37, 49], "e08d610c7479": [37, 49], "nativ": [37, 51], "0000003": [37, 41, 51], "0000461": [37, 50, 53], "5945426": 37, "ciliat": [37, 38], "columnar": [37, 38], "tracheobronchi": 37, "tree": 37, "0002145": 37, "57": [37, 38], "hsapdv": [37, 50], "0000151": 37, "0002771": 37, "0000384": [37, 53], "5945428": 37, "0000625": [37, 41], "0005097": 37, "5945432": 37, "0000624": [37, 41], "0005061": 37, "5945441": 37, "2907151": 37, "8c42cfd0": [37, 45, 46, 49], "0b0a": [37, 45, 46, 49], "46d5": [37, 45, 46, 49], "910c": [37, 45, 46, 49], "fc833d83c45e": [37, 45, 46, 49], "0000669": [37, 41], "0000145": 37, "0000383": [37, 53], "2907152": 37, "2907153": 37, "2907154": 37, "2907155": 37, "deeper": 37, "dive": 37, "characterist": 37, "set_index": [37, 40, 44, 46, 52, 53], "f171db61": [37, 45, 46, 50], "e57": [37, 45, 46, 50], "4535": [37, 45, 46, 50], "a06a": [37, 45, 46, 50], "35d8b6ef8f2b": [37, 45, 46, 50], "developm": [37, 45, 46], "donor_p13_trophoblast": [37, 45, 46], "ecf2e08": [37, 45, 46], "2032": [37, 45, 46], "4a9e": [37, 45, 46], "b466": [37, 45, 46], "b65b395f4a02": [37, 45, 46], "74cff64f": [37, 45, 46], "9da9": [37, 45, 46], "4b2a": [37, 45, 46], "9b3b": [37, 45, 46], "8a04a1598040": [37, 45, 46], "vivo": [37, 45, 46], "5af90777": [37, 45, 46], "6760": [37, 45, 46], "4003": [37, 45, 46], "9dba": [37, 45, 46], "8f945fec6fdf": [37, 45, 46], "intr": [37, 45, 46], "bd65a70f": [37, 45, 46], "b274": [37, 45, 46], "4133": [37, 45, 46], "b9dd": [37, 45, 46], "0d1431b6af34": [37, 45, 46], "multiregion": [37, 45, 46], "imm": [37, 45, 46], "f9ad5649": [37, 45, 46], "f372": [37, 45, 46], "43e1": [37, 45, 46], "a3a8": [37, 45, 46], "423383e5a8a2": [37, 45, 46], "molecular": [37, 45, 46], "character": [37, 39, 45, 46, 47], "vuln": [37, 45, 46], "456e8b9b": [37, 45, 46], "f872": [37, 45, 46], "488b": [37, 45, 46], "871d": [37, 45, 46], "94534090a865": [37, 45, 46], "peripher": [37, 45, 46], "immun": [37, 45, 46, 47], "respon": [37, 45, 46], "589": [37, 45, 46], "2adb1f8a": [37, 45, 46, 50], "a6b1": [37, 45, 46, 50], "4909": [37, 45, 46, 50], "8ee8": [37, 45, 46, 50], "484814e2d4bf": [37, 45, 46, 50], "landscap": [37, 45, 46], "sing": [37, 45, 46], "590": [37, 45, 46], "e04daea4": [37, 45, 46], "4412": [37, 45, 46], "45b5": [37, 45, 46], "989e": [37, 45, 46], "76a9be070a89": [37, 45, 46], "krasnow": [37, 45, 46], "591": [37, 45, 46], "592": [37, 45, 46], "append": [37, 48], "dataset_cell_count": 37, "cell_count": 37, "merg": [37, 38, 48, 52], "1e6a6ef9": 37, "7ec9": 37, "4c90": 37, "bbfb": 37, "2ad3c3165fd1": 37, "1028006": 37, "resolut": [37, 49], "luca": 37, "ex": 37, "314": 37, "784630": 37, "f7c1c579": 37, "2dc0": 37, "47e2": 37, "ba19": 37, "8165c5a0e353": 37, "217738": 37, "fetal": 37, "survei": 37, "embryon": 37, "483": 37, "d8da613f": 37, "e681": 37, "4c69": 37, "b463": 37, "e94f5e66847f": 37, "116313": 37, "lethal": 37, "80": [37, 38, 51], "576f193c": 37, "75d0": 37, "4a11": 37, "bd25": 37, "8676587e6dc2": 37, "90384": 37, "htan": 37, "msk": 37, "377": 37, "d41f45c1": 37, "1b7b": 37, "4573": 37, "a998": 37, "ac5c5acb1647": 37, "82991": 37, "reg": 37, "regulatori": 37, "58": [37, 38], "3dc61ca1": 37, "ce40": 37, "46b6": 37, "8337": 37, "f27260fd9a03": 37, "71752": 37, "uncov": 37, "proxima": 37, "325": 37, "60993": 37, "2672b679": 37, "8048": 37, "4f5e": 37, "9786": 37, "f1b196ccfd08": 37, "57019": 37, "spleen": [37, 45, 47], "parenchyma": 37, "416": 37, "9dbab10c": 37, "118d": 37, "496b": 37, "966a": 37, "67f1763a6b7d": 37, "49014": 37, "criti": 37, "482": 37, "9968be68": 37, "ab65": 37, "4a38": 37, "9e1a": 37, "c9b6abece194": 37, "47909": 37, "chart": 37, "endod": 37, "78": [37, 38], "3de0ad6d": 37, "4378": 37, "4f62": 37, "b37b": 37, "ec0b75a50d94": 37, "46500": 37, "lungmap": 37, "broad": 37, "ag": [37, 39, 47], "healthi": 37, "456": 37, "2f132ec9": 37, "24b5": 37, "422f": 37, "9be0": 37, "ccef03b4fe28": 37, "39778": 37, "sar": 37, "cov": 37, "receptor": [37, 51], "ace2": [37, 49], "tmprss2": 37, "prima": 37, "312": 37, "1e5bd3b8": 37, "6a0e": 37, "4959": 37, "8d69": 37, "cafed30fe814": 37, "35699": 37, "emphysema": [37, 50], "130": 37, "35682": [37, 45], "475": [37, 45], "1b9d8702": 37, "5af8": 37, "4142": 37, "85ed": 37, "020eb06ec4f6": 37, "35419": 37, "tiss": 37, "411": 37, "4ed927e9": 37, "c099": 37, "49af": 37, "b8ce": 37, "a2652d069333": 37, "35284": 37, "367": 37, "33698": 37, "4b6af54a": 37, "4a21": 37, "46e0": 37, "bc8d": 37, "673c0561a836": 37, "18386": 37, "01209dce": 37, "3575": 37, "4bed": 37, "b1df": 37, "129f57fbc031": 37, "11059": 37, "8657": 37, "f9846bb4": 37, "784d": 37, "4582": 37, "92c1": 37, "3f279e4c6f0c": 37, "176": [37, 45], "fibroblast": [37, 38, 49, 51], "smooth": 37, "muscl": [37, 38, 45, 47], "317": 37, "f64e1be1": 37, "de15": 37, "4d27": 37, "8da4": 37, "82225cd4c035": 37, "55": [37, 38, 53], "370": 37, "810ac45f": 37, "8969": 37, "4698": 37, "b42c": 37, "652f802f75c2": 37, "endothelium": 37, "320": 37, "0ba16f4b": 37, "cb87": 37, "4fa3": 37, "9363": 37, "19fc51eec6e7": 37, "myeloid": [37, 38], "326": 37, "reprens": 37, "divers": [37, 41, 45, 48], "plastic": 37, "tumor": 37, "neutrophil": 37, "subpopul": 37, "distal": 37, "gradient": 37, "differenti": [37, 38], "regul": 37, "epitheli": [37, 38, 45, 47, 51, 54], "fate": 37, "tell": 37, "1236968": 37, "702074": 37, "262323": 37, "122902": 37, "97432": 37, "65220": 37, "41852": 37, "25662": 37, "8638": 37, "8016": 37, "1164084": 37, "772120": 37, "331019": 37, "209675": 37, "120796": 37, "55254": 37, "51343": 37, "45714": 37, "31923": 37, "31792": 37, "31540": 37, "21167": 37, "17590": 37, "12374": 37, "10765": 37, "doesn": 37, "1402565": 37, "1122990": 37, "381601": 37, "2468587": 37, "438569": 37, "head": [37, 45], "alveolar": [37, 51], "macrophag": [37, 38], "291507": 37, "263362": 37, "211456": 37, "189471": 37, "154415": 37, "ii": 37, "128463": 37, "tract": 37, "105090": 37, "102303": 37, "killer": [37, 38, 47, 49], "95953": 37, "92846": 37, "stromal": [37, 38, 45, 47], "87714": 37, "81125": 37, "malign": 37, "75917": 37, "plasma": 37, "64551": 37, "59353": 37, "45305": 37, "capillari": 37, "39416": 37, "36381": 37, "36049": 37, "35467": 37, "2576327": 37, "147410": 37, "alveolu": 37, "54085": 37, "lingula": 37, "upper": [37, 45], "lobe": 37, "32099": 37, "17854": 37, "12880": 37, "10113": 37, "9276": 37, "7981": 37, "middl": 37, "3847": 37, "lung_var": 37, "ensg00000121410": [37, 45], "a1bg": [37, 45], "3999": [37, 45], "ensg00000268895": [37, 45], "as1": [37, 45], "3374": [37, 45], "ensg00000148584": [37, 45], "a1cf": [37, 45], "9603": [37, 45], "ensg00000175899": [37, 45], "a2m": [37, 45], "6318": [37, 45], "ensg00000245105": [37, 45], "2948": [37, 45], "ensg00000288719": [37, 45], "rp4": [37, 45], "669p10": [37, 45], "ensg00000288720": [37, 45], "rp11": [37, 45], "852e15": [37, 45], "7007": [37, 45], "ensg00000288721": [37, 45], "rp5": [37, 45], "973n23": [37, 45], "7765": [37, 45], "ensg00000288723": [37, 45], "553n16": [37, 45], "1015": [37, 45], "ensg00000288724": [37, 45], "rp13": [37, 45], "546i2": [37, 45], "625": [37, 45], "60664": [37, 42, 45, 48, 54], "actual": [37, 54], "mislead": 37, "know": [37, 47, 50], "presence_matrix": [37, 39, 45], "get_presence_matrix": [37, 39, 45], "a1": 37, "17811": 37, "50259": 37, "44150": 37, "34265": 37, "22447": 37, "23642": 37, "26347": 37, "20921": 37, "24672": 37, "27705": 37, "27243": 37, "26323": 37, "27181": 37, "23203": 37, "57042": 37, "32610": 37, "29620": 37, "26454": 37, "23705": 37, "38676": 37, "47307": 37, "23740": 37, "22552": 37, "20594": 37, "19952": 37, "uint64": 37, "genes_measur": 37, "var_somaid": 37, "nonzero": [37, 39], "ensg00000128274": 37, "a4galt": 37, "3358": 37, "ensg00000094914": 37, "aaa": 37, "4727": 37, "ensg00000081760": 37, "aac": 37, "16039": 37, "29951": 37, "ensg00000177272": 37, "kcna3": 37, "2476": 37, "30157": 37, "ensg00000184709": 37, "lrrc26": 37, "1209": 37, "30185": 37, "ensg00000087250": 37, "mt3": 37, "1679": 37, "30202": 37, "ensg00000136352": 37, "nkx2": 37, "3165": 37, "30512": 37, "ensg00000231439": 37, "wasir2": 37, "1054": 37, "11595": 37, "composit": 37, "infect": 37, "12k": 37, "intens": 37, "exercis": 37, "exploratori": 37, "000": 37, "lung_cell_subsampled_n": 37, "100000": 37, "lung_cell_subsampled_id": 37, "random_st": 37, "lung_gene_id": 37, "lung_adata": 37, "highest_expr_gen": 37, "n_top": 37, "calculate_qc_metr": 37, "percent_top": 37, "inplac": [37, 40], "violin": [37, 40], "n_genes_by_count": 37, "groupbi": [37, 40, 49, 51], "rotat": 37, "90": 37, "total_count": 37, "outlier": 37, "exlcud": 37, "ll": [37, 39, 53], "extra": 37, "preprocess": 37, "_highly_variable_gen": 37, "_simpl": 37, "843": 37, "view_to_actu": 37, "28": [37, 38, 49, 54], "n_cell_typ": 37, "drop_dupl": [37, 50], "randint": 37, "rang": [37, 38, 40, 42, 48, 54], "06x": 37, "0xffffff": 37, "palett": 37, "legend_loc": 37, "hard": 37, "32": [37, 38, 54], "top_cell_typ": 37, "reset_index": [37, 44], "lung_adata_top_cell_typ": 37, "unix": [38, 40], "interfac": [38, 40, 42, 48, 49, 54], "mkdir": [38, 40], "p": [38, 40, 43, 44, 52], "wget": [38, 40], "nv": [38, 40], "pbmc3k_filtered_gene_bc_matric": [38, 40], "tar": [38, 40], "gz": [38, 40], "cf": [38, 40], "10xgenom": [38, 40], "pbmc3k": [38, 40], "xzf": [38, 40], "09": [38, 48], "38": [38, 49, 52], "7621991": [38, 40], "gt": [38, 40, 42, 45, 49], "deatail": [38, 40], "insid": [38, 40], "geneformer_info": 38, "cxg_embedding_info": [38, 40], "model_link": [38, 40, 48], "cli": [38, 46], "fine_tuned_geneform": 38, "progress": [38, 49], "bertforsequenceclassif": 38, "datacollatorforcellclassif": 38, "transcriptometoken": 38, "embextractor": 38, "ml": [38, 54], "huggingfac": 38, "geneformertoken": 38, "ensembl": [38, 40, 49], "ensembl_id": [38, 40], "n_count": [38, 40], "joinid": [38, 40, 45, 48], "write": [38, 46], "disk": 38, "read_10x_mtx": [38, 40], "filtered_gene_bc_matric": [38, 40], "hg19": [38, 40], "gene_id": [38, 40], "h5ad_dir": 38, "makedir": 38, "track": 38, "token_dir": 38, "tokenized_data": 38, "custom_attr_name_dict": 38, "tokenize_data": 38, "data_directori": 38, "output_directori": 38, "output_prefix": 38, "file_format": 38, "filter_pass": 38, "model_dir": 38, "label_mapping_dict_fil": 38, "label_to_cell_subclass": 38, "fp": 38, "label_mapping_dict": 38, "best4": 38, "cn": 38, "sensu": 38, "vertebrata": 38, "gabaerg": 38, "abnorm": 38, "adventiti": [38, 49], "anim": 38, "cardiocyt": 38, "skelet": 38, "cuboid": 38, "contractil": 38, "defens": 38, "duct": 38, "ecto": 38, "ectoderm": 38, "endo": 38, "pancrea": [38, 45, 47], "urethra": 38, "eukaryot": 38, "fat": [38, 45], "germ": [38, 51], "glandular": 38, "35": [38, 54], "glial": 38, "37": 38, "hematopoiet": [38, 50], "precursor": 38, "hepatocyt": 38, "inflammatori": 38, "interneuron": [38, 45], "42": 38, "ionocyt": 38, "44": [38, 40, 49], "45": [38, 52], "46": 38, "leukocyt": [38, 54], "47": 38, "lymphocyt": 38, "48": [38, 44], "49": 38, "mammari": [38, 47], "mesenchym": [38, 49], "52": [38, 44], "meso": 38, "mesoderm": 38, "motor": 38, "mural": 38, "59": [38, 47], "myofibroblast": 38, "neural": 38, "termin": 38, "ovarian": 38, "surfac": 38, "67": [38, 52], "phagocyt": 38, "pigment": 38, "cultur": [38, 51], "71": 38, "primordi": 38, "progenitor": [38, 49], "73": 38, "salivari": 38, "sebac": 38, "75": [38, 45], "secretori": 38, "76": 38, "sensori": 38, "77": 38, "seromucu": 38, "secret": [38, 49], "somat": 38, "79": 38, "stem": [38, 49, 50, 53], "81": [38, 44], "82": 38, "83": [38, 44, 52], "84": 38, "transit": 38, "85": 38, "86": 38, "87": 38, "vertebr": 38, "load_from_disk": 38, "input_id": 38, "num_row": 38, "2700": 38, "dummi": [38, 40], "add_column": 38, "slow": 38, "pretrain": 38, "from_pretrain": 38, "data_col": 38, "vector": 38, "predicted_label_id": 38, "argmax": [38, 54], "predicted_label": 38, "predicted_cell_subclass": 38, "min_mean": 38, "0125": 38, "max_mean": 38, "min_disp": 38, "svd_solver": 38, "arpack": 38, "scapi": 38, "original_cell_typ": [38, 40], "cd14": [38, 40], "fcgr3a": [38, 40], "megakaryocyt": [38, 40], "rename_categori": 38, "titl": [38, 42, 48], "n_class": 38, "output_dir": 38, "geneformer_embed": 38, "embex": 38, "model_typ": 38, "cellclassifi": 38, "num_class": 38, "max_ncel": 38, "emb_label": 38, "emb_lay": 38, "forward_batch_s": 38, "nproc": 38, "extract_emb": 38, "model_directori": 38, "input_data_fil": 38, "re": [38, 42, 45], "grab": [38, 41, 45, 48, 52], "c697eaaf": [38, 40], "a3b": [38, 40], "4251": [38, 40], "b036": [38, 40], "5f9052179e70": [38, 40], "f2a488bf": [38, 40], "782f": [38, 40], "4c20": [38, 40], "a8e5": [38, 40], "cb34d48c1f7e": [38, 40], "fa8605cf": [38, 40], "f27e": [38, 40], "44af": [38, 40], "ac2a": [38, 40], "476bee4410d3": [38, 40], "3c75a463": [38, 40], "6a87": [38, 40], "4132": [38, 40], "83a8": [38, 40], "c3002624394d": [38, 40], "adata_censu": [38, 40], "simplifi": [38, 44], "shared_gen": 38, "index_subset": [38, 40], "3000": [38, 40], "adata_join": 38, "outer": 38, "liver_dataset": 39, "liver_dataset_id": 39, "liver_adata": 39, "859": 39, "52392": [39, 44, 46, 52], "gene_pres": 39, "17992": 39, "992": 39, "toarrai": [39, 42, 48], "000e": 39, "590e": 39, "02": [39, 42, 43, 48], "969e": 39, "03": [39, 42, 45, 46], "280e": 39, "250e": 39, "400e": 39, "gene_length": 39, "00000000e": 39, "58654413e": 39, "32001885e": 39, "74444813e": 39, "31455088e": 39, "04": [39, 42, 48], "71500419e": 39, "78985747e": 39, "real": 39, "filter_cel": 39, "min_gen": 39, "filter_gen": 39, "min_cel": 39, "saniti": 39, "prepar": 40, "pbmc": 40, "3k": 40, "scvi_info": 40, "pt": 40, "functool": 40, "yaml": 40, "randomforestclassifi": 40, "unassign": 40, "model_filenam": 40, "prepare_query_anndata": 40, "is_train": 40, "trick": 40, "forward": [40, 54], "reprsent": 40, "vae_q": 40, "load_query_data": 40, "gene_symbol": [40, 49], "notnul": 40, "perfectli": 40, "appropri": 40, "markers_row1": 40, "il7r": 40, "lyz": 40, "ms4a1": 40, "cd8a": 40, "gnly": 40, "markers_row2": 40, "nkg7": 40, "ms4a7": 40, "fcer1a": 40, "cst3": 40, "ppbp": 40, "catch_warn": 40, "nk": 40, "label_map": 40, "adata_census_subset": 40, "adata_combin": 40, "correl": 40, "forest": 40, "classifi": 40, "rfc": 40, "predicted_cell_typ": [40, 54], "enough": [41, 44], "itself": 41, "tip": 41, "soma_df": 41, "faster": 41, "refin": 41, "_obs_": 41, "unique_cell_type_ontology_term_id": 41, "lot": 41, "top_10": 41, "nthe": 41, "0000525": [41, 50], "2000060": [41, 50], "0008036": [41, 50], "0002488": 41, "0002343": 41, "0000084": 41, "0001078": 41, "0000815": 41, "0000235": 41, "3000001": 41, "0000540": 41, "7665340": 41, "0000679": 41, "1894047": 41, "0000128": 41, "1881077": 41, "1508920": 41, "1477453": 41, "1419507": 41, "0000057": 41, "1397813": 41, "0000860": 41, "1369142": 41, "1308000": [41, 51], "4023040": 41, "1229658": 41, "occurr": 41, "lung_tissu": 41, "ntop": 41, "185": 41, "0002063": 41, "0000775": 41, "0001044": 41, "0001050": 41, "0000814": 41, "0000071": 41, "0000192": 41, "0002503": 41, "0002370": 41, "562038": 41, "0000583": 41, "526859": 41, "323985": 41, "323610": 41, "266333": 41, "255425": 41, "205013": 41, "0000623": 41, "164944": 41, "0001064": 41, "149067": 41, "0002632": 41, "132243": 41, "0002082": 41, "ooo2084": 41, "0002080": 41, "0000746": 41, "49929": 41, "0008034": 41, "33361": 41, "0002548": 41, "33180": 41, "0002131": 41, "30915": 41, "0000115": 41, "30054": 41, "18391": 41, "0000763": 41, "14408": 41, "13552": 41, "9690": 41, "0002144": 41, "9025": 41, "labl": 41, "cols_to_queri": 41, "complet": [41, 51], "df": [41, 49], "col": [41, 44, 45], "tuniqu": 41, "tongu": [42, 45, 47, 48, 54], "372": [42, 48], "axisarrai": [42, 48], "featu": [42, 48], "soma_data": [42, 44, 47, 48], "bfloat16": [42, 48], "bit": [42, 48], "expon": [42, 48], "mantissa": [42, 48], "simplest": [42, 48], "nervou": [42, 48], "manner": [42, 48, 54], "befor": [42, 48], "correspondong": [42, 48], "31780": [42, 48], "to_anndata": [42, 48], "mehtod": 42, "sparsendarrayread": 42, "turn": [42, 46], "emb_it": 42, "vstack": [42, 48], "31780x200": 42, "6356000": 42, "9672852e": 42, "2878418e": 42, "8632812e": 42, "5742188e": 42, "0664062e": 42, "3198853e": 42, "5390625e": 42, "9814453e": 42, "5078125e": 42, "6015625e": 42, "0000000e": 42, "6132812e": 42, "0070801e": 42, "9165039e": 42, "4296875e": 42, "9648438e": 42, "8828125e": 42, "1796875e": 42, "7109375e": 42, "3315430e": 42, "8125000e": 42, "6953125e": 42, "4218750e": 42, "4316406e": 42, "2756348e": 42, "1494141e": 42, "2187500e": 42, "4140625e": 42, "7890625e": 42, "1484375e": 42, "9663086e": 42, "2942505e": 42, "4531250e": 42, "6315918e": 42, "4765625e": 42, "2656250e": 42, "200": 42, "ependym": 42, "astrocyt": 42, "31775": 42, "oligodendrocyt": 42, "31776": 42, "31777": 42, "31778": 42, "31779": 42, "75694072": 43, "45846761": 43, "16292": 43, "2153": 43, "doi": [43, 48], "1002": 43, "ctm2": 43, "1356": 43, "695": 43, "696": 43, "697": 43, "1016": [43, 45, 46], "isci": 43, "698": 43, "1371": 43, "journal": 43, "699": 43, "700": 43, "cardiac": 43, "atrium": 43, "slice_dataset": 43, "isin": [43, 45], "sep": 43, "1126": [43, 45], "abl4896": [43, 45], "4866a804": 43, "37eb": 43, "436f": 43, "8c87": 43, "9cd585260061": 43, "e5f58829": [43, 45], "1a66": [43, 45], "40b5": [43, 45], "a624": [43, 45], "9046778e74f5": [43, 45], "bfd80f12": 43, "725c": 43, "4482": 43, "ad7f": 43, "1ed2b4909b0d": 43, "e6df8a57": 43, "f54f": 43, "413a": 43, "9d4d": 43, "dee03294d778": 43, "8d599205": 43, "5c51": 43, "4b50": 43, "9d48": 43, "3dec31238587": 43, "f6065c51": 43, "bd26": 43, "4aa5": 43, "a05d": 43, "2805aeea48d9": 43, "8cdbf790": 43, "4d29": 43, "4f46": 43, "9aef": 43, "21adfb2e21da": 43, "mybpc3": 43, "easier": 44, "experiment_queri": 44, "x_as_seri": 44, "nd": 44, "raw_n": 44, "iloc": 44, "expens": 44, "var_df": [44, 45, 52], "float64": 44, "coo": 44, "arrow_tbl": 44, "var_dim": 44, "by_var": 44, "errstat": 44, "raw_mean": 44, "ensmusg00000051951": [44, 52], "xkr4": [44, 52], "6094": [44, 52], "202": 44, "032743": 44, "ensmusg00000089699": [44, 52], "gm1992": [44, 52], "250": [44, 52], "ensmusg00000102343": [44, 52], "gm37381": [44, 52], "1364": [44, 52], "ensmusg00000025900": [44, 52], "rp1": [44, 52], "12311": [44, 52], "106": 44, "236265": 44, "ensmusg00000025902": [44, 52], "sox17": [44, 52], "4772": [44, 52], "3259": 44, "991975": 44, "52387": [44, 52], "ensmusg00000081591": [44, 52], "btf3": [44, 52], "ps9": [44, 52], "496": [44, 52], "52388": [44, 52], "ensmusg00000118710": [44, 52], "mmu": [44, 52], "mir": [44, 52], "467a": [44, 52], "3_ensmusg00000118710": [44, 52], "52389": [44, 52], "ensmusg00000119584": [44, 52], "rn18": [44, 52], "1849": [44, 52], "52390": [44, 52], "ensmusg00000118538": [44, 52], "gm18218": [44, 52], "970": [44, 52], "52391": [44, 52], "ensmusg00000084217": [44, 52], "setd9": [44, 52], "670": [44, 52], "welford": [44, 53], "npt": 44, "onlinematrixmeanvari": 44, "n_sampl": 44, "n_variabl": 44, "axix": 44, "n_a": 44, "int32": [44, 54], "u_a": 44, "m2_a": 44, "coord_vec": 44, "value_vec": 44, "_mean_variance_upd": 44, "m2": 44, "_mean_variance_fin": 44, "max": 44, "jit": 44, "nopython": 44, "col_arr": 44, "val_arr": 44, "squar": 44, "val": 44, "u_prev": 44, "m2_prev": 44, "accont": 44, "chan": 44, "adapt": [44, 48], "n_b": 44, "u_b": 44, "m2_b": 44, "mvn": 44, "raw_vari": 44, "848": 44, "312801": 44, "169": 44, "182975": 44, "279575": 44, "656207": 44, "malat1": 44, "ptprd": 44, "dlg2": 44, "pcdh9": 44, "n_cells_by_dataset": 44, "multiindex": 44, "from_product": 44, "n_cell": 44, "x_tbl": 44, "to_fram": 44, "get_index": 44, "pick": [44, 46], "3bbb6cf9": 44, "72b9": 44, "41be": 44, "b568": 44, "656de6eb18b5": 44, "ensmusg00000028399": 44, "79578": 44, "58b01044": 44, "c5e5": 44, "4b0f": 44, "8a2d": 44, "6ebf951e01ff": 44, "474": 44, "ensmusg00000052572": 44, "79513": 44, "98e5ea9f": [44, 53], "16d6": [44, 53], "47ec": [44, 53], "a529": [44, 53], "686e76515e39": [44, 53], "908": 44, "66ff82b4": 44, "9380": 44, "469c": 44, "bc4b": 44, "cfa08eacd325": 44, "c08f8441": 44, "4a10": 44, "4748": 44, "872a": 44, "e70c0bcccdba": 44, "ensmusg00000055421": 44, "79476": 44, "125": [44, 54], "3027": 44, "2910": 44, "117": 44, "ensmusg00000092341": 44, "79667": 44, "12622": 44, "20094": 44, "7102": 44, "12992": 44, "compil": 45, "n_dataset": 45, "therein": [45, 46], "human_rna": 45, "datasets_df": 45, "e2c257e7": [45, 46], "6f79": [45, 46], "487c": [45, 46], "b81c": [45, 46], "39451cd4ab3c": [45, 46], "023": [45, 46], "05869": [45, 46], "31497": [45, 46], "67070": [45, 46], "286326": [45, 46], "f7cecffa": [45, 46], "00b4": [45, 46], "4560": [45, 46], "a29a": [45, 46], "8ad626b8ee08": [45, 46], "ccell": [45, 46], "001": [45, 46], "270855": [45, 46], "3f50314f": [45, 46], "bdc9": [45, 46], "40c6": [45, 46], "8e4a": [45, 46], "b0901ebfbe4c": [45, 46], "2021": [45, 46], "007": [45, 46], "167283": [45, 46], "180bff9c": [45, 46], "c8a5": [45, 46], "4539": [45, 46], "b13b": [45, 46], "ddbc00d643e6": [45, 46], "s41593": [45, 46], "00764": [45, 46], "8168": [45, 46], "a72afd53": [45, 46], "ab92": [45, 46], "4511": [45, 46], "88da": [45, 46], "252fb0e26b9a": [45, 46], "s41591": [45, 46], "0944": [45, 46], "y": [45, 46], "44721": [45, 46], "38833785": [45, 46], "fac5": [45, 46], "48fd": [45, 46], "944a": [45, 46], "0f62a4c23ed1": [45, 46], "2157": [45, 46], "598266": [45, 46], "5d445965": [45, 46], "6f1a": [45, 46], "4b68": [45, 46], "ba3a": [45, 46], "b8f765155d3a": [45, 46], "2922": [45, 46], "9409": [45, 46], "65662": [45, 46], "593x60664": 45, "16133717": 45, "manipul": 45, "ensg00000286096": 45, "97a17473": 45, "e2b1": 45, "4f31": 45, "a544": 45, "44a60773e2dd": 45, "var_joinid": 45, "dataset_joinid": 45, "is_pres": 45, "tocoo": 45, "ff45e623": 45, "7f5f": 45, "46e3": 45, "b47d": 45, "56be0341f66b": 45, "13497": 45, "f01bdd17": 45, "4902": 45, "40f5": 45, "86e3": 45, "240d66dd2587": 45, "salivary_gland": 45, "27199": 45, "e6a11140": 45, "2545": 45, "46bc": 45, "929e": 45, "da243eed2ca": 45, "11505": 45, "e5c63d94": 45, "593c": 45, "4338": 45, "a489": 45, "e1048599e751": 45, "bladder": [45, 47], "24583": 45, "d8732da6": 45, "8d1d": 45, "42d9": 45, "b625": 45, "f2416c30054b": 45, "trachea": [45, 47], "9522": 45, "cee11228": 45, "9f0b": 45, "4e57": 45, "afe2": 45, "cfe15ee56312": 45, "34004": 45, "a357414d": 45, "2042": 45, "4eb5": 45, "95f0": 45, "c58604a18bdd": 45, "small_intestin": 45, "12467": 45, "a0754256": 45, "f44b": 45, "4c4a": 45, "962c": 45, "a552e47d3fdc": 45, "10650": 45, "983d5ec9": 45, "40e8": 45, "4512": 45, "9e65": 45, "a572a9c486cb": 45, "50115": 45, "5e5e7a2f": 45, "8f1c": 45, "42ac": 45, "90dc": 45, "b4f80f38e84c": 45, "20263": 45, "55cf0ea3": 45, "9d2b": 45, "4294": 45, "871e": 45, "bb4b49a79fc7": 45, "15020": [45, 54], "4f1555bc": 45, "4664": 45, "46c3": 45, "a606": 45, "78d34dd10d92": 45, "bone_marrow": [45, 46], "12297": 45, "2423ce2c": 45, "3149": 45, "4cca": 45, "a2ff": 45, "cf682ea29b5f": 45, "9641": 45, "1c9eb291": 45, "6d31": 45, "47e1": 45, "96b2": 45, "129b5e1ae64f": 45, "30746": 45, "18eb630b": 45, "a754": 45, "4111": 45, "8cd4": 45, "c24ec80aa5ec": 45, "lymph_nod": 45, "53275": 45, "0d2ee4ac": 45, "05ee": 45, "40b2": 45, "afb6": 45, "ebb584caa867": 45, "0ced5e76": 45, "6040": 45, "47ff": 45, "8a72": 45, "93847965afc0": 45, "thymu": [45, 47], "33664": 45, "283d65eb": 45, "dd53": 45, "496d": 45, "adb7": 45, "7570c7caa443": 45, "1101": [45, 48], "511898": 45, "8e10f1c4": 45, "8e98": 45, "41e5": 45, "b65f": 45, "8cd89a887122": 45, "2480956": 45, "139": 45, "fe1a73ab": 45, "a203": 45, "45fd": 45, "84e9": 45, "0f7fd19efcbd": 45, "dissect": 45, "amygdaloid": 45, "ami": [45, 56], "basolat": 45, "35285": 45, "143": 45, "f8dda921": 45, "5fb4": 45, "4c94": 45, "a654": 45, "c6fc346bfd6d": 45, "cerebr": 45, "cortex": 45, "cx": 45, "occipitotem": 45, "31899": 45, "160": 45, "dd03ce70": 45, "3243": 45, "4c96": 45, "9561": 45, "330cc461e4d7": 45, "perirhin": 45, "23732": 45, "165": 45, "d2b5efc1": 45, "14c6": 45, "4b5f": 45, "bd98": 45, "40f9084872d7": 45, "tail": 45, "hippocampu": 45, "hit": 45, "caudal": 45, "36886": 45, "175": 45, "c4b03352": 45, "af8d": 45, "492a": 45, "8d6b": 45, "40f304e0a122": 45, "superclust": 45, "medium": 45, "spini": 45, "152189": 45, "c2aad8fc": 45, "b63b": 45, "4f9b": 45, "9cfd": 45, "baf7bc9c1771": 45, "tempor": 45, "po": 45, "37642": 45, "177": 45, "c202b243": 45, "1aa1": 45, "4b16": 45, "bc9a": 45, "b36241f3b1e3": 45, "amygdala": 45, "excitatori": 45, "109452": 45, "178": 45, "bdb26abd": 45, "f4ba": 45, "4ea3": 45, "8862": 45, "c2340e7a4f55": 45, "cge": 45, "227671": 45, "183": 45, "acae7679": 45, "d077": 45, "461c": 45, "b857": 45, "ee6ccfeb267f": 45, "hih": 45, "ca1": 45, "39147": 45, "196": 45, "9372df2d": 45, "13d6": 45, "4fac": 45, "980b": 45, "919a5b7eb483": 45, "midbrain": 45, "periaqueduct": 45, "grai": 45, "33794": 45, "197": 45, "93131426": 45, "0124": 45, "4ab4": 45, "a013": 45, "9dfbcd99d467": 45, "epithalamu": 45, "eth": 45, "24327": 45, "206": [45, 52], "7c1c3d47": 45, "3166": 45, "43e5": 45, "9a95": 45, "65ceb2d45f78": 45, "pon": 45, "pn": 45, "pontin": 45, "reticular": 45, "49512": 45, "208": 45, "7a0a8891": 45, "9a22": 45, "4549": 45, "a55b": 45, "c2aca23c3a2a": 45, "hippocamp": 45, "74979": 45, "5e5ab909": 45, "f73f": 45, "4b57": 45, "98a0": 45, "6d2c5662f6a4": 45, "inferior": 45, "colliculu": 45, "32306": 45, "3f56901c": 45, "dd4a": 45, "47d6": 45, "b60b": 45, "7b0c0111cfb2": 45, "37911": 45, "3a7f3ab4": 45, "a280": 45, "4b3b": 45, "b2c0": 45, "6dd05614a78c": 45, "splatter": 45, "291833": 45, "249": 45, "35c8a04c": 45, "8639": 45, "4d15": 45, "8228": 45, "765d8d93fc96": 45, "hypothalamu": 45, "hth": 45, "supraopt": 45, "16753": 45, "270": 45, "07b1d7c8": 45, "5c2e": 45, "42f7": 45, "9246": 45, "26f746cd6013": 45, "myelencephalon": 45, "medulla": 45, "oblongata": 45, "27210": 45, "273": 45, "0325478a": 45, "9b52": 45, "b40a": 45, "2e2ab0d72eb1": 45, "intratelencephal": 45, "455006": 45, "483152": 45, "476": 45, "a68b64d8": 45, "aee3": 45, "4947": 45, "81b7": 45, "36b8fe5a44d2": 45, "82478": 45, "477": 45, "c5d88abe": 45, "f23a": 45, "45fa": 45, "a534": 45, "788985e93dad": 45, "264824": 45, "478": 45, "5a11f879": 45, "d1ef": 45, "458a": 45, "9b0bdfca5ebf": 45, "31691": 45, "479": 45, "104148": 45, "17481d16": 45, "ee44": 45, "49e5": 45, "bcf0": 45, "28c0780d8c4a": 45, "58109": 45, "ensg00000277745": 45, "h2ab3": 45, "58354": 45, "ensg00000233522": 45, "fam224a": 45, "2031": 45, "58411": 45, "ensg00000183146": 45, "prori": 45, "878": 45, "58523": 45, "ensg00000279274": 45, "533e23": 45, "58632": 45, "ensg00000277836": 45, "27211": 45, "all_experi": 46, "organism_nam": 46, "organism_experi": 46, "experiments_total_cel": 46, "num_cel": 46, "nfound": 46, "5255245": 46, "toolchain": 46, "0bd1a1d": 46, "3aee": 46, "40e0": 46, "b2ec": 46, "86c7a30c7149": 46, "522": 46, "atl": 46, "40220": [46, 47], "submitt": 46, "tabula_muris_seni": 46, "cp": 46, "lineag": [47, 48], "jin": 47, "tabula_muris_dataset_id": 47, "48b37086": [47, 49, 53], "25f7": [47, 49, 53], "4ecd": [47, 49, 53], "be66": [47, 49, 53], "f5bb378e3aea": [47, 49, 53], "tabula_muris_ob": 47, "35718": 47, "limb": 47, "28867": 47, "24540": 47, "21647": 47, "20680": 47, "12295": 47, "9275": 47, "lumen": 47, "8945": 47, "8613": 47, "7976": 47, "6777": 47, "6201": 47, "skin": [47, 53], "bodi": [47, 53], "4454": 47, "1887": 47, "tabula_muris_liver_dataset_id": 47, "tabula_muris_liver_ob": 47, "awar": 47, "chanc": 47, "priori": [47, 50], "sai": 47, "nk_cell": 47, "80935": 47, "nk_cells_primari": 47, "59109": 47, "aqp5": [47, 50], "adata_primari": 47, "demo": [47, 51], "awai": 47, "break": 47, "8448858": 47, "52812487": 47, "52812553": 47, "52812556": 47, "52812566": 47, "113": 47, "170": 47, "37033": 47, "37052": 47, "36904": 47, "36919": 47, "meaning": 48, "confirm": 48, "easiest": [48, 50], "embd": 48, "impli": 48, "anoth": 48, "sp": 48, "embbed": 48, "obs_joinid": 48, "embeddinng": 48, "stand": 48, "alon": 48, "00506592": 48, "01348877": 48, "03173828": 48, "02331543": 48, "02404785": 48, "02441406": 48, "00595093": 48, "0065918": 48, "00070572": 48, "00187683": 48, "04663086": 48, "04614258": 48, "115722": 48, "512": [48, 52], "advanc": [48, 52], "portion": 48, "caution": 48, "quit": 48, "500_000": 48, "fail": [48, 52], "embedding_slic": 48, "emb_data": 48, "emb_joinid": 48, "reindex_disable_on_axi": 48, "embedding_presence_mask": 48, "getnnz": 48, "embedding_data": 48, "embedding_joinid": 48, "00762939": 48, "00076675": 48, "00047874": 48, "03588867": 48, "00405884": 48, "00239563": 48, "00982666": 48, "00946045": 48, "00473022": 48, "0135498": 48, "01049805": 48, "03051758": 48, "critic": 48, "meaningless": 48, "embedding_metadata": 48, "toward": 48, "ai": 48, "burgeon": 48, "pioneer": 48, "million": 48, "distil": 48, "concern": 48, "transfer": 48, "optim": [48, 54], "superior": 48, "primary_contact": 48, "bo": 48, "wang": 48, "bowang": 48, "vectorinstitut": 48, "affili": 48, "toronto": 48, "additional_contact": 48, "538439": 48, "additional_inform": 48, "data_typ": 48, "obs_embed": 48, "n_embed": 48, "62998417": 48, "n_featur": 48, "submission_d": 48, "nonsens": 48, "assert": 48, "laura": 49, "luebbert": 49, "lauraluebbert": 49, "caltech": 49, "edu": 49, "databas": 49, "facilit": [49, 55], "cite": 49, "googl": 49, "colab": 49, "q": 49, "setup": 49, "fri": 49, "jul": 49, "succesfulli": 49, "gget_cellxgen": 49, "speci": 49, "meta_onli": 49, "verbos": 49, "arg": 49, "slc5a1": 49, "ensg00000130234": 49, "ensg00000100170": 49, "ui": 49, "celltyp": 49, "mucu": 49, "neuroendocrin": 49, "canon": 49, "cellular": 49, "reus": 49, "secondari": 49, "portal": 49, "9b94ccb0a2e0a8f6182b213aa4852c491f6f6aff": 49, "backend": 49, "wmg": 49, "tissue_mapp": 49, "abca1": 49, "minut": 49, "3679": 49, "thousand": 49, "ensg00000165029": 49, "11343": 49, "5332": 49, "9739": 49, "24539": 49, "5081": 49, "3674": 49, "3675": 49, "3676": 49, "3677": 49, "3678": 49, "retina": 49, "config": 49, "inlinebackend": 49, "figure_format": 49, "dotplot": 49, "categor": 49, "ensmusg00000015405": 49, "047d57f2": 49, "4d14": 49, "45de": 49, "aa98": 49, "336c6f583750": 49, "97547": 49, "97548": 49, "97549": 49, "97550": 49, "97551": 49, "97552": 49, "example_adata": 49, "example_meta": 49, "querycondit": 50, "2313": 50, "2308": 50, "2309": 50, "2310": 50, "2311": 50, "2312": 50, "8626": 50, "1884": 50, "27047": 50, "tubb4b": 50, "2037": 50, "materi": 50, "shortli": 50, "comparison": 50, "op": 50, "sex_cell_metadata": 50, "669": 50, "385437": 50, "metatadata": 50, "cell_metadata_all_unknown_sex": 50, "9th": 50, "post": 50, "fertil": 50, "0000046": 50, "decidua": 50, "basali": 50, "0000453": 50, "placenta": 50, "0001987": 50, "3251329": 50, "56274573": 50, "cord": 50, "2000095": 50, "newborn": 50, "0000082": 50, "han": 50, "chines": 50, "0027": 50, "umbil": 50, "0012168": 50, "0000178": 50, "3251330": 50, "56274574": 50, "3251331": 50, "56274575": 50, "3251332": 50, "56274576": 50, "3251333": 50, "56274577": 50, "3251334": 50, "cell_metadata_b_cel": 50, "42720": 50, "10631": 50, "8742": 50, "8187": 50, "2083": 50, "1534": 50, "1512": 50, "1474": 50, "1210": 50, "332": 50, "204": 50, "133": 50, "gene_metadata": 50, "isn": 51, "narrow": 51, "as_index": 51, "0000001": 51, "0000006": 51, "2502": 51, "0000015": 51, "621": 51, "0000019": 51, "608": 51, "4028006": 51, "38250": 51, "609": 51, "4030009": 51, "tubul": 51, "segment": 51, "777": 51, "610": 51, "4030011": 51, "989": 51, "611": 51, "4030018": 51, "princip": 51, "107": [51, 52], "612": 51, "4030023": 51, "hillock": 51, "10170": 51, "semant": 52, "maxmimum": 52, "nois": 52, "disabl": 52, "docstr": 52, "hvgs_df": 52, "highly_variable_rank": 52, "230445": 52, "116": 52, "044863": 52, "749637": 52, "287551": 52, "276809": 52, "461324": 52, "407450": 52, "363945": 52, "055626": 52, "280": 52, "958509": 52, "combined_df": [52, 53], "188": 52, "ensmusg00000026117": 52, "zap70": 52, "2992": 52, "409091": 52, "14793": 52, "026717": 52, "350": 52, "775560": 52, "233": 52, "ensmusg00000026073": 52, "il1r2": 52, "1908": 52, "764085": 52, "41918": 52, "471500": 52, "402176": 52, "ensmusg00000026185": 52, "igfbp5": 52, "6006": 52, "234876": 52, "314355": 52, "591239": 52, "156": 52, "825651": 52, "ensmusg00000026180": 52, "cxcr2": 52, "3048": 52, "379390": 52, "10491": 52, "033344": 52, "640129": 52, "30296": 52, "ensmusg00000024803": 52, "ankrd1": 52, "2886": 52, "548572": 52, "274005": 52, "455137": 52, "741864": 52, "30313": 52, "ensmusg00000024987": 52, "cyp26a1": 52, "1983": 52, "186686": 52, "12973": 52, "622003": 52, "454": 52, "580162": 52, "30379": 52, "ensmusg00000018822": 52, "sfrp5": 52, "1900": 52, "927853": 52, "10943": 52, "645525": 52, "410": 52, "637004": 52, "32042": 52, "ensmusg00000031838": 52, "ifi30": 52, "91": 52, "676950": 52, "995276": 52, "564962": 52, "205886": 52, "33314": 52, "ensmusg00000092572": 52, "serpinb10": 52, "3490": 52, "264085": 52, "239812": 52, "487": 52, "535469": 52, "who": 52, "own": 52, "mv_df": 53, "3095357": 53, "915025": 53, "69571": 53, "774917": 53, "3095359": 53, "972801": 53, "9471": 53, "427044": 53, "3095363": 53, "169472": 53, "139042": 53, "208628": 53, "3095366": 53, "049836": 53, "24762": 53, "926397": 53, "3095368": 53, "345415": 53, "150412": 53, "440839": 53, "3278898": 53, "164319": 53, "339741": 53, "3278899": 53, "368339": 53, "930156": 53, "3278900": 53, "246049": 53, "886186": 53, "3278901": 53, "240724": 53, "307266": 53, "3278902": 53, "278420": 53, "086994": 53, "9314": 53, "keratinocyt": [53, 54], "0002337": 53, "mmusdv": 53, "0000089": 53, "18_53_m": 53, "0002097": 53, "18_47_f": 53, "basal": [53, 54], "epidermi": 53, "0002187": 53, "0000091": 53, "epiderm": 53, "0000362": 53, "logist": 54, "regress": 54, "primer": 54, "census_ml": 54, "experiment_datapip": 54, "10_000": 54, "mechan": 54, "encapsul": 54, "caller": 54, "importantli": 54, "lazili": 54, "avoid": 54, "legaci": 54, "interchang": 54, "torchdata": 54, "shuffler": 54, "strategi": 54, "held": 54, "1gb": 54, "caus": 54, "valid": 54, "randomsplitt": 54, "train_datapip": 54, "test_datapip": 54, "random_split": 54, "weight": 54, "experiment_dataload": 54, "enforc": 54, "nn": 54, "linear": 54, "logisticregress": 54, "input_dim": 54, "output_dim": 54, "super": 54, "sigmoid": 54, "train_epoch": 54, "train_dataload": 54, "loss_fn": 54, "devic": 54, "train_loss": 54, "train_correct": 54, "train_tot": 54, "zero_grad": 54, "softmax": 54, "loss": 54, "propag": 54, "backward": 54, "train_accuraci": 54, "secondli": 54, "42496620": 54, "42496621": 54, "42496622": 54, "42496633": 54, "42496634": 54, "42496635": 54, "desir": 54, "cuda": 54, "is_avail": 54, "cell_type_encod": 54, "classes_": 54, "crossentropyloss": 54, "adam": 54, "lr": 54, "7f": 54, "accuraci": 54, "4f": 54, "0167253": 54, "4856": 54, "0156710": 54, "4943": 54, "0149408": 54, "4813": 54, "0144469": 54, "5040": 54, "0141749": 54, "5669": 54, "0139776": 54, "6672": 54, "0138565": 54, "7920": 54, "0138094": 54, "8088": 54, "0136689": 54, "8757": 54, "0136101": 54, "8923": 54, "invok": 54, "eval": 54, "recov": 54, "At": 54, "pickl": 54, "unpickl": 54, "vein": 54, "123": 54, "124": 54, "127": 54, "helper": 55, "vscode": 56, "m6i": 56, "8xlarg": 56, "mount": 56, "nvme": 56, "drive": 56, "swap": 56, "third": 56, "parti": 56, "misc": 56, "soma_typ": 56, "clone": 56, "absent": 57, "paralleliz": 57}, "objects": {"": [[55, 0, 0, "-", "cellxgene_census"]], "cellxgene_census": [[1, 1, 1, "", "download_source_h5ad"], [9, 1, 1, "", "get_anndata"], [10, 1, 1, "", "get_census_version_description"], [11, 1, 1, "", "get_census_version_directory"], [12, 1, 1, "", "get_default_soma_context"], [13, 1, 1, "", "get_presence_matrix"], [14, 1, 1, "", "get_source_h5ad_uri"], [15, 1, 1, "", "open_soma"]], "cellxgene_census.experimental.ml.pytorch": [[2, 2, 1, "", "ExperimentDataPipe"], [3, 2, 1, "", "Stats"], [4, 1, 1, "", "experiment_dataloader"]], "cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe": [[2, 3, 1, "", "__init__"]], "cellxgene_census.experimental.ml.pytorch.Stats": [[3, 3, 1, "", "__init__"]], "cellxgene_census.experimental.pp": [[5, 1, 1, "", "get_highly_variable_genes"], [6, 1, 1, "", "highly_variable_genes"], [7, 1, 1, "", "mean_variance"]], "cellxgene_census.experimental.util": [[8, 1, 1, "", "X_sparse_iter"]]}, "objtypes": {"0": "py:module", "1": "py:function", "2": "py:class", "3": "py:method"}, "objnames": {"0": ["py", "module", "Python module"], "1": ["py", "function", "Python function"], "2": ["py", "class", "Python class"], "3": ["py", "method", "Python method"]}, "titleterms": {"api": [0, 20, 21, 31, 52, 53, 55], "document": 0, "cellxgene_censu": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 21, 42, 48], "download_source_h5ad": 1, "experiment": [2, 3, 4, 5, 6, 7, 8, 52, 55], "ml": [2, 3, 4], "pytorch": [2, 3, 4, 54], "experimentdatapip": [2, 54], "stat": [3, 19, 41], "experiment_dataload": 4, "pp": [5, 6, 7], "get_highly_variable_gen": [5, 52], "highly_variable_gen": [6, 52], "mean_vari": 7, "util": [8, 19, 55], "x_sparse_it": 8, "get_anndata": [9, 42, 48], "get_census_version_descript": 10, "get_census_version_directori": 11, "get_default_soma_context": 12, "get_presence_matrix": 13, "get_source_h5ad_uri": 14, "open_soma": 15, "what": [16, 21, 22, 30, 57], "": [16, 30, 49], "new": [16, 19, 21, 30, 32], "2023": [16, 22], "r": [17, 20, 23, 25], "packag": [17, 38], "cellxgen": [17, 20, 24, 27, 28, 29, 33, 34, 42, 48, 49], "censu": [17, 19, 20, 21, 22, 24, 26, 27, 28, 29, 30, 31, 32, 33, 34, 36, 37, 38, 39, 41, 43, 45, 46, 47, 48, 50, 53, 54, 55], "v1": 17, "i": [17, 21, 22, 57], "out": [17, 47, 53], "instal": [17, 21, 23, 25, 49, 56], "usag": 17, "made": 17, "possibl": 17, "tiledbsoma": 17, "effici": [17, 18, 25], "access": [17, 19, 20, 42, 48], "singl": [17, 18, 19, 21, 26, 37, 38, 46, 50], "cell": [17, 18, 19, 22, 25, 26, 28, 34, 36, 37, 38, 40, 41, 42, 43, 44, 45, 47, 48, 49, 50, 51, 55], "data": [17, 19, 20, 21, 22, 24, 26, 28, 29, 32, 33, 34, 35, 37, 38, 39, 40, 46, 47, 48, 49, 50, 55], "33m": 17, "from": [17, 21, 35, 36, 37, 38, 46, 49], "easi": 17, "us": [17, 18, 19, 21, 24, 32, 33, 38, 40, 44, 49], "handl": 17, "cloud": 17, "host": [17, 21, 48], "queri": [17, 19, 21, 25, 42, 43, 48, 49, 50], "read": [17, 47], "metadata": [17, 19, 22, 25, 28, 34, 37, 41, 43, 48, 49, 50], "export": [17, 19, 32], "slice": [17, 25, 35, 43, 53, 55], "seurat": [17, 25], "singlecellexperi": [17, 25], "stream": 17, "increment": [17, 44, 53], "chunk": 17, "memori": [18, 25], "implement": 18, "commonli": 18, "method": 18, "calcul": [18, 19, 37, 44, 51, 53], "averag": 18, "varianc": [18, 44, 53], "gene": [18, 19, 34, 35, 37, 39, 41, 44, 45, 49, 50, 52], "express": [18, 37, 39, 46, 49, 50], "across": 18, "million": 18, "how": [18, 19, 20, 21], "work": 18, "exampl": [18, 30, 31, 34, 38, 39, 40, 41, 47, 53], "kra": 18, "aqp4": 18, "lung": [18, 36, 37], "epitheli": 18, "highli": [18, 52], "variabl": [18, 52], "find": [18, 35], "all": [18, 34, 37, 41, 45], "human": [18, 21, 34, 37], "esophagu": 18, "introduc": 19, "normal": [19, 21, 28, 35, 37, 39], "layer": [19, 21, 37], "pre": [19, 51], "statist": 19, "descript": 19, "ad": 19, "librari": 19, "size": 19, "enhanc": 19, "featur": [19, 21, 28, 55], "exist": 19, "toolkit": 19, "via": [19, 42, 43, 48], "tiledb": [19, 20], "soma": [19, 20, 26, 57], "ob": [19, 28, 47, 49, 50], "var": [19, 28, 50], "help": 19, "u": 19, "improv": 19, "addit": 19, "cz": [20, 24, 28, 29, 33, 34, 49], "discov": [20, 24, 28, 29, 33, 49], "aw": 20, "avail": [20, 34], "specif": [20, 45], "releas": [20, 22, 24, 29, 33], "version": [20, 22, 28, 55, 56], "cli": 20, "programat": 20, "download": [20, 38, 40, 46], "python": [20, 21, 23, 25, 32, 55, 56], "faq": 21, "why": [21, 47], "should": 21, "contain": 21, "do": 21, "cite": [21, 24, 33], "public": 21, "doe": 21, "have": 21, "embed": [21, 32, 36, 37, 38, 42, 48], "differenti": 21, "other": [21, 38], "tool": [21, 24, 33, 35], "can": 21, "mous": [21, 35], "where": 21, "ar": [21, 47], "retriev": [21, 55], "origin": [21, 46], "h5ad": [21, 46], "dataset": [21, 28, 35, 37, 38, 45, 46, 54], "which": 21, "wa": 21, "built": 21, "increas": 21, "perform": [21, 38], "my": 21, "conda": 21, "ask": 21, "support": [21, 22], "contribut": 21, "get": [21, 55], "an": [21, 42, 47, 48, 49, 54], "arrayschema": 21, "error": 21, "when": [21, 47], "open": [21, 34, 39, 41, 45, 50, 54, 55], "run": 21, "import": [21, 36, 38], "databrick": 21, "long": 22, "term": 22, "lt": 22, "weekli": 22, "latest": [22, 56], "list": 22, "12": 22, "15": 22, "inform": [22, 28, 29], "donor": 22, "count": [22, 28, 34, 44, 51], "embbed": 22, "07": 22, "25": 22, "05": 22, "errata": 22, "duplic": [22, 47], "observ": [22, 36], "is_primary_data": [22, 31], "true": 22, "requir": [23, 36, 38, 40, 43], "capabl": [24, 33], "schema": [24, 26, 28, 33], "question": [24, 33], "feedback": [24, 33], "issu": [24, 33], "come": [24, 33], "soon": [24, 33], "project": [24, 33, 38, 40], "quick": [25, 42, 48], "start": [25, 42, 48], "obtain": 25, "anndata": [25, 42, 43, 47, 48, 49, 55], "object": [25, 26, 49], "summari": [26, 28, 34, 37, 51], "info": [26, 34], "census_info": [26, 28], "census_data": [26, 28], "includ": [26, 28, 34], "mirror": 27, "overview": 28, "definit": [28, 29, 36], "speci": 28, "multi": [28, 35], "constraint": 28, "assai": [28, 34, 37], "matrix": [28, 45, 55], "type": [28, 34, 37, 40, 41, 49], "sampl": [28, 36], "repeat": 28, "encod": 28, "organ": [28, 34], "census_obj": 28, "somacollect": 28, "somadatafram": 28, "tabl": [28, 31, 34, 46], "summary_cell_count": 28, "somaexperi": 28, "raw": 28, "m": 28, "rna": 28, "x": [28, 44], "somasparsendarrai": 28, "presenc": [28, 45, 55], "feature_dataset_presence_matrix": 28, "changelog": 28, "1": 28, "3": 28, "0": 28, "2": 28, "storag": [29, 42, 48], "polici": 29, "json": 29, "articl": 30, "editori": [30, 31], "guidelin": [30, 31], "locat": 30, "titl": [30, 31], "date": 30, "author": 30, "introduct": [30, 31], "section": [30, 31], "notebook": 31, "vignett": 31, "content": [31, 34, 48], "knowledg": 31, "reinforc": 31, "tutori": 32, "integr": [32, 35], "model": [32, 38, 40, 54], "uderstand": 32, "analyz": 32, "scalabl": 32, "comput": [32, 44], "machin": [32, 55], "learn": [32, 34, 37, 55], "about": [34, 37], "main": 34, "compon": 34, "each": [34, 45], "sequenc": [34, 39], "number": 34, "microgli": 34, "understand": [34, 47], "beyond": [34, 51], "liver": [34, 35], "diseas": [34, 37], "t": 34, "tissu": [34, 36, 37, 49], "fetch": [35, 36, 37, 39, 45, 46, 48, 49, 50, 51], "10x": [35, 38], "genom": 35, "smart": [35, 39], "seq2": 35, "length": [35, 39], "scvi": [35, 40, 42], "inspect": [35, 38], "prior": 35, "batch": 35, "defin": [35, 54], "dataset_id": [35, 44], "donor_id": 35, "assay_ontology_term_id": 35, "suspension_typ": 35, "explor": [36, 37, 39, 46, 51], "biolog": 36, "relev": 36, "cluster": [36, 39], "background": [36, 48], "function": 36, "melanocyt": 36, "ey": 36, "150k": 36, "retin": 36, "bipolar": 36, "neuron": 36, "dopaminerg": 36, "brain": 36, "pulmonari": 36, "ionocyt": 36, "tabula": [36, 47], "sapien": 36, "sex": 37, "v": 37, "nucleu": 37, "sub": 37, "qc": 37, "metric": 37, "creat": [37, 47, 51, 54], "geneform": [38, 42], "class": [38, 54], "predict": [38, 40, 54], "system": [38, 40], "fine": 38, "tune": 38, "prepar": 38, "subclass": 38, "infer": [38, 40], "load": [38, 42, 48], "token": 38, "result": 38, "gener": [38, 43], "pbmc": 38, "3k": 38, "join": 38, "full": [39, 41], "seq": 39, "account": 39, "valid": 39, "through": 39, "train": [40, 54], "pretrain": 40, "summar": 41, "subset": 41, "select": [41, 49], "value_filt": 41, "collabor": 42, "format": [42, 48], "associ": [42, 48], "obsm": [42, 48], "slot": [42, 48], "experimentaxisqueri": [42, 48], "scipi": 42, "matric": 42, "numpi": [42, 48], "arrai": [42, 48], "citat": 43, "string": 43, "onlin": 44, "algorithm": 44, "mean": [44, 53], "per": 44, "group": 44, "measur": 45, "id": 45, "identifi": 45, "sourc": 46, "file": 46, "filter": 47, "muri": 47, "seni": 47, "frame": 47, "core": [47, 53], "oper": 47, "dens": 48, "gget": 49, "modul": 49, "set": [49, 56], "up": [49, 56], "plot": 49, "dot": 49, "similar": 49, "those": 49, "shown": 49, "onli": 49, "correspond": 49, "command": 49, "line": 49, "census_summary_cell_count": 51, "datafram": 51, "valu": 51, "The": 53, "explain": 54, "paramet": 54, "split": 54, "dataload": 54, "make": 54, "build": 55, "process": 55, "depend": 56, "environ": 56, "verifi": 56, "your": 56, "develop": 56}, "envversion": {"sphinx.domains.c": 2, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 8, "sphinx.domains.index": 1, "sphinx.domains.javascript": 2, "sphinx.domains.math": 2, "sphinx.domains.python": 3, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "nbsphinx": 4, "sphinx.ext.intersphinx": 1, "sphinx": 57}, "alltitles": {"API Documentation": [[0, "api-documentation"]], "cellxgene_census.download_source_h5ad": [[1, "cellxgene-census-download-source-h5ad"]], "cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe": [[2, "cellxgene-census-experimental-ml-pytorch-experimentdatapipe"]], "cellxgene_census.experimental.ml.pytorch.Stats": [[3, "cellxgene-census-experimental-ml-pytorch-stats"]], "cellxgene_census.experimental.ml.pytorch.experiment_dataloader": [[4, "cellxgene-census-experimental-ml-pytorch-experiment-dataloader"]], "cellxgene_census.experimental.pp.get_highly_variable_genes": [[5, "cellxgene-census-experimental-pp-get-highly-variable-genes"]], "cellxgene_census.experimental.pp.highly_variable_genes": [[6, "cellxgene-census-experimental-pp-highly-variable-genes"]], "cellxgene_census.experimental.pp.mean_variance": [[7, "cellxgene-census-experimental-pp-mean-variance"]], "cellxgene_census.experimental.util.X_sparse_iter": [[8, "cellxgene-census-experimental-util-x-sparse-iter"]], "cellxgene_census.get_anndata": [[9, "cellxgene-census-get-anndata"]], "cellxgene_census.get_census_version_description": [[10, "cellxgene-census-get-census-version-description"]], "cellxgene_census.get_census_version_directory": [[11, "cellxgene-census-get-census-version-directory"]], "cellxgene_census.get_default_soma_context": [[12, "cellxgene-census-get-default-soma-context"]], "cellxgene_census.get_presence_matrix": [[13, "cellxgene-census-get-presence-matrix"]], "cellxgene_census.get_source_h5ad_uri": [[14, "cellxgene-census-get-source-h5ad-uri"]], "cellxgene_census.open_soma": [[15, "cellxgene-census-open-soma"]], "What\u2019s new?": [[16, "what-s-new"]], "2023": [[16, "id1"]], "R package cellxgene.census V1 is out!": [[17, "r-package-cellxgene-census-v1-is-out"]], "Installation and usage": [[17, "installation-and-usage"]], "Census R package is made possible by tiledbsoma": [[17, "census-r-package-is-made-possible-by-tiledbsoma"]], "Efficient access to single-cell data for >33M cells from R": [[17, "efficient-access-to-single-cell-data-for-33m-cells-from-r"]], "Easy-to-use handles to the cloud-hosted Census data": [[17, "easy-to-use-handles-to-the-cloud-hosted-census-data"]], "Querying and reading single-cell metadata from Census": [[17, "querying-and-reading-single-cell-metadata-from-census"]], "Exporting Census slices to Seurat and SingleCellExperiment": [[17, "exporting-census-slices-to-seurat-and-singlecellexperiment"]], "Streaming data incrementally in chunks": [[17, "streaming-data-incrementally-in-chunks"]], "Memory-efficient implementations of commonly used single-cell methods": [[18, "memory-efficient-implementations-of-commonly-used-single-cell-methods"]], "Efficient calculation of average and variance gene expression across millions of cells": [[18, "efficient-calculation-of-average-and-variance-gene-expression-across-millions-of-cells"]], "How it works": [[18, "how-it-works"], [18, "id1"]], "Example: KRAS and AQP4 average and variance expression in lung epithelial cells": [[18, "example-kras-and-aqp4-average-and-variance-expression-in-lung-epithelial-cells"]], "Efficient calculation of highly variable genes across millions of cells": [[18, "efficient-calculation-of-highly-variable-genes-across-millions-of-cells"]], "Example: Finding highly variable genes for all cells of the human esophagus": [[18, "example-finding-highly-variable-genes-for-all-cells-of-the-human-esophagus"]], "Introducing a normalized layer and pre-calculated cell and gene statistics in Census": [[19, "introducing-a-normalized-layer-and-pre-calculated-cell-and-gene-statistics-in-census"]], "Description of new data added to Census": [[19, "description-of-new-data-added-to-census"]], "Added a new library-size normalized layer": [[19, "added-a-new-library-size-normalized-layer"]], "Enhanced gene metadata": [[19, "enhanced-gene-metadata"]], "Enhanced cell metadata": [[19, "enhanced-cell-metadata"]], "How to use the new features": [[19, "how-to-use-the-new-features"]], "Exporting the normalized data to existing single-cell toolkits": [[19, "exporting-the-normalized-data-to-existing-single-cell-toolkits"]], "Accessing library-size normalized data layer via TileDB-SOMA": [[19, "accessing-library-size-normalized-data-layer-via-tiledb-soma"]], "Utilizing pre-calculated stats for querying obs and var": [[19, "utilizing-pre-calculated-stats-for-querying-obs-and-var"]], "Help us improve these data additions": [[19, "help-us-improve-these-data-additions"]], "CZ CELLxGENE Discover Census in AWS": [[20, "cz-cellxgene-discover-census-in-aws"]], "Census data available in AWS": [[20, "census-data-available-in-aws"]], "Data specifications": [[20, "data-specifications"]], "Data release versioning": [[20, "data-release-versioning"]], "How to access AWS Census data": [[20, "how-to-access-aws-census-data"]], "AWS CLI for programatic downloads": [[20, "aws-cli-for-programatic-downloads"]], "CELLxGENE Census API (Python and R)": [[20, "cellxgene-census-api-python-and-r"]], "TileDB-SOMA API (Python and R)": [[20, "tiledb-soma-api-python-and-r"]], "FAQ": [[21, "faq"]], "Why should I use the Census?": [[21, "why-should-i-use-the-census"]], "What data is contained in the Census?": [[21, "what-data-is-contained-in-the-census"]], "How do I cite the use of the Census for a publication?": [[21, "how-do-i-cite-the-use-of-the-census-for-a-publication"]], "Why does the Census not have a normalized layer or embeddings?": [[21, "why-does-the-census-not-have-a-normalized-layer-or-embeddings"]], "How does the Census differentiate from other tools?": [[21, "how-does-the-census-differentiate-from-other-tools"]], "Can I query human and mouse data in a single query?": [[21, "can-i-query-human-and-mouse-data-in-a-single-query"]], "Where are the Census data hosted?": [[21, "where-are-the-census-data-hosted"]], "Can I retrieve the original H5AD datasets from which the Census was built?": [[21, "can-i-retrieve-the-original-h5ad-datasets-from-which-the-census-was-built"]], "How can I increase the performance of my queries?": [[21, "how-can-i-increase-the-performance-of-my-queries"]], "Can I use conda to install the Census Python API?": [[21, "can-i-use-conda-to-install-the-census-python-api"]], "How can I ask for support?": [[21, "how-can-i-ask-for-support"]], "How can I ask for new features?": [[21, "how-can-i-ask-for-new-features"]], "How can I contribute my data to the Census?": [[21, "how-can-i-contribute-my-data-to-the-census"]], "Why do I get an ArraySchema error when opening the Census?": [[21, "why-do-i-get-an-arrayschema-error-when-opening-the-census"]], "Why do I get an error when running import cellxgene_census on Databricks?": [[21, "why-do-i-get-an-error-when-running-import-cellxgene-census-on-databricks"]], "Census data releases": [[22, "census-data-releases"]], "What is a Census data release?": [[22, "what-is-a-census-data-release"]], "Long-term supported (LTS) Census releases": [[22, "long-term-supported-lts-census-releases"]], "Weekly Census releases (latest)": [[22, "weekly-census-releases-latest"]], "List of LTS Census data releases": [[22, "list-of-lts-census-data-releases"]], "LTS 2023-12-15": [[22, "lts-2023-12-15"]], "Version information": [[22, "version-information"], [22, "id1"], [22, "id4"]], "Cell and donor counts": [[22, "cell-and-donor-counts"], [22, "id2"], [22, "id5"]], "Cell metadata": [[22, "cell-metadata"], [22, "id3"], [22, "id6"], [34, "Cell-metadata"]], "Cell embbedings": [[22, "cell-embbedings"]], "LTS 2023-07-25": [[22, "lts-2023-07-25"]], "LTS 2023-05-15": [[22, "lts-2023-05-15"]], "\ud83d\udd34 Errata \ud83d\udd34": [[22, "errata"]], "Duplicate observations with  is_primary_data = True": [[22, "duplicate-observations-with-is-primary-data-true"]], "Installation": [[23, "installation"], [25, "installation"], [56, "installation"]], "Requirements": [[23, "requirements"], [36, "Requirements"], [38, "Requirements"], [40, "Requirements"], [43, "Requirements"]], "Python": [[23, "python"]], "R": [[23, "r"]], "CZ CELLxGENE Discover Census": [[24, "cz-cellxgene-discover-census"], [33, "cz-cellxgene-discover-census"]], "Citing Census": [[24, "citing-census"], [33, "citing-census"]], "Census Capabilities": [[24, "census-capabilities"], [33, "census-capabilities"]], "Census Data and Schema": [[24, "census-data-and-schema"], [33, "census-data-and-schema"]], "Census Data Releases": [[24, "census-data-releases"], [33, "census-data-releases"]], "Questions, Feedback and Issues": [[24, "questions-feedback-and-issues"], [33, "questions-feedback-and-issues"]], "Coming Soon!": [[24, "coming-soon"], [33, "coming-soon"]], "Projects and Tools Using Census": [[24, "projects-and-tools-using-census"], [33, "projects-and-tools-using-census"]], "Quick start": [[25, "quick-start"], [42, "Quick-start"], [48, "Quick-start"]], "Python quick start": [[25, "python-quick-start"]], "Querying a slice of cell metadata": [[25, "querying-a-slice-of-cell-metadata"], [25, "id1"]], "Obtaining a slice as AnnData": [[25, "obtaining-a-slice-as-anndata"]], "Memory-efficient queries": [[25, "memory-efficient-queries"], [25, "id2"]], "R quick start": [[25, "r-quick-start"]], "Obtaining a slice as a Seurat or SingleCellExperiment object": [[25, "obtaining-a-slice-as-a-seurat-or-singlecellexperiment-object"]], "Census data and schema": [[26, "census-data-and-schema"]], "Schema": [[26, "schema"], [28, "schema"]], "Census summary info \"census_info\"": [[26, "census-summary-info-census-info"]], "Census single-cell data \"census_data\"": [[26, "census-single-cell-data-census-data"]], "Data included in the Census": [[26, "data-included-in-the-census"]], "SOMA objects": [[26, "soma-objects"]], "CELLxGENE Census Mirroring": [[27, "cellxgene-census-mirroring"]], "CZ CELLxGENE Discover Census Schema": [[28, "cz-cellxgene-discover-census-schema"]], "Census overview": [[28, "census-overview"]], "Definitions": [[28, "definitions"], [29, "definitions"]], "Census Schema versioning": [[28, "census-schema-versioning"]], "Data included": [[28, "data-included"]], "Species": [[28, "species"]], "Multi-species data constraints": [[28, "multi-species-data-constraints"]], "Assays": [[28, "assays"], [37, "Assays"]], "Data matrix types": [[28, "data-matrix-types"]], "Sample types": [[28, "sample-types"]], "Repeated data": [[28, "repeated-data"]], "Data encoding and organization": [[28, "data-encoding-and-organization"]], "Census information census_obj[\"census_info\"] - SOMACollection": [[28, "census-information-census-obj-census-info-somacollection"]], "Census metadata \u2013 census_obj\u200b\u200b[\"census_info\"][\"summary\"] \u2013 SOMADataFrame": [[28, "census-metadata-census-obj-census-info-summary-somadataframe"]], "Census table of CELLxGENE Discover datasets \u2013 census_obj[\"census_info\"][\"datasets\"] \u2013 SOMADataFrame": [[28, "census-table-of-cellxgene-discover-datasets-census-obj-census-info-datasets-somadataframe"]], "Census summary cell counts  \u2013 census_obj[\"census_info\"][\"summary_cell_counts\"] \u2013 SOMADataframe": [[28, "census-summary-cell-counts-census-obj-census-info-summary-cell-counts-somadataframe"]], "Census Data \u2013 census_obj[\"census_data\"][organism] \u2013 SOMAExperiment": [[28, "census-data-census-obj-census-data-organism-somaexperiment"]], "Matrix Data, count (raw) matrix \u2013 census_obj[\"census_data\"][organism].ms[\"RNA\"].X[\"raw\"] \u2013 SOMASparseNDArray": [[28, "matrix-data-count-raw-matrix-census-obj-census-data-organism-ms-rna-x-raw-somasparsendarray"]], "Matrix Data, normalized count matrix \u2013 census_obj[\"census_data\"][organism].ms[\"RNA\"].X[\"normalized\"] \u2013 SOMASparseNDArray": [[28, "matrix-data-normalized-count-matrix-census-obj-census-data-organism-ms-rna-x-normalized-somasparsendarray"]], "Feature metadata \u2013 census_obj[\"census_data\"][organism].ms[\"RNA\"].var \u2013 SOMADataFrame": [[28, "feature-metadata-census-obj-census-data-organism-ms-rna-var-somadataframe"]], "Feature dataset presence matrix \u2013 census_obj[\"census_data\"][organism].ms[\"RNA\"][\"feature_dataset_presence_matrix\"] \u2013 SOMASparseNDArray": [[28, "feature-dataset-presence-matrix-census-obj-census-data-organism-ms-rna-feature-dataset-presence-matrix-somasparsendarray"]], "Cell metadata \u2013 census_obj[\"census_data\"][organism].obs \u2013 SOMADataFrame": [[28, "cell-metadata-census-obj-census-data-organism-obs-somadataframe"]], "Changelog": [[28, "changelog"]], "Version 1.3.0": [[28, "version-1-3-0"]], "Version 1.2.0": [[28, "version-1-2-0"]], "Version 1.1.0": [[28, "version-1-1-0"]], "Version 1.0.0": [[28, "version-1-0-0"]], "Version 0.1.1": [[28, "version-0-1-1"]], "Version 0.1.0": [[28, "version-0-1-0"]], "Version 0.0.1": [[28, "version-0-0-1"]], "CZ CELLxGENE Discover Census storage & release policy": [[29, "cz-cellxgene-discover-census-storage-release-policy"]], "Census data storage policy": [[29, "census-data-storage-policy"]], "Census release information json": [[29, "census-release-information-json"]], "Census \u201cwhat\u2019s new?\u201d article editorial guidelines": [[30, "census-what-s-new-article-editorial-guidelines"]], "Location": [[30, "location"]], "Guidelines": [[30, "guidelines"], [31, "guidelines"]], "Title": [[30, "title"], [31, "title"]], "Date & author": [[30, "date-author"]], "Introduction": [[30, "introduction"], [31, "introduction"]], "Sections": [[30, "sections"], [31, "sections"]], "Example article": [[30, "example-article"]], "Census API notebook/vignette editorial guidelines": [[31, "census-api-notebook-vignette-editorial-guidelines"]], "Table of Contents": [[31, "table-of-contents"]], "is_primary_data knowledge reinforcement": [[31, "is-primary-data-knowledge-reinforcement"]], "Example notebook/vignette": [[31, "example-notebook-vignette"]], "Python tutorials": [[32, "python-tutorials"]], "Exporting data": [[32, "exporting-data"]], "[NEW! \ud83d\ude80] Using integrated embeddings and models": [[32, "new-using-integrated-embeddings-and-models"]], "Uderstanding Census data": [[32, "uderstanding-census-data"]], "Analyzing Census data": [[32, "analyzing-census-data"]], "Scalable computing": [[32, "scalable-computing"]], "Scalable machine learning": [[32, "scalable-machine-learning"]], "Learning about the CZ CELLxGENE Census": [[34, "Learning-about-the-CZ-CELLxGENE-Census"]], "Opening the Census": [[34, "Opening-the-Census"], [41, "Opening-the-Census"], [45, "Opening-the-Census"]], "Census organization": [[34, "Census-organization"]], "Main Census components": [[34, "Main-Census-components"]], "Census summary info": [[34, "Census-summary-info"]], "Census data": [[34, "Census-data"]], "Gene metadata": [[34, "Gene-metadata"]], "Census summary content tables": [[34, "Census-summary-content-tables"]], "Cell counts by cell metadata": [[34, "Cell-counts-by-cell-metadata"]], "Example: cell metadata included in the summary counts table": [[34, "Example:-cell-metadata-included-in-the-summary-counts-table"]], "Example: cell counts for each sequencing assay in human data": [[34, "Example:-cell-counts-for-each-sequencing-assay-in-human-data"]], "Example: number of microglial cells in the Census": [[34, "Example:-number-of-microglial-cells-in-the-Census"]], "Understanding Census contents beyond the summary tables": [[34, "Understanding-Census-contents-beyond-the-summary-tables"]], "Example: all cell types available in human": [[34, "Example:-all-cell-types-available-in-human"]], "Example: cell types available in human liver": [[34, "Example:-cell-types-available-in-human-liver"]], "Example: diseased T cells in human tissues": [[34, "Example:-diseased-T-cells-in-human-tissues"]], "Integrating multi-dataset slices of data": [[35, "Integrating-multi-dataset-slices-of-data"]], "Finding and fetching data from mouse liver (10X Genomics and Smart-Seq2)": [[35, "Finding-and-fetching-data-from-mouse-liver-(10X-Genomics-and-Smart-Seq2)"]], "Gene-length normalization of Smart-Seq2 data.": [[35, "Gene-length-normalization-of-Smart-Seq2-data."]], "Integration with scvi-tools": [[35, "Integration-with-scvi-tools"]], "Inspecting data prior to integration": [[35, "Inspecting-data-prior-to-integration"]], "Data integration with scVI": [[35, "Data-integration-with-scVI"]], "Integration with batch defined as dataset_id": [[35, "Integration-with-batch-defined-as-dataset_id"]], "Integration with batch defined as dataset_id + donor_id": [[35, "Integration-with-batch-defined-as-dataset_id-+-donor_id"]], "Integration with batch defined as dataset_id + donor_id + assay_ontology_term_id + suspension_type": [[35, "Integration-with-batch-defined-as-dataset_id-+-donor_id-+-assay_ontology_term_id-+-suspension_type"]], "Exploring biologically relevant clusters in Census embeddings": [[36, "Exploring-biologically-relevant-clusters-in-Census-embeddings"]], "Background": [[36, "Background"], [48, "Background"]], "Imports and function definitions": [[36, "Imports-and-function-definitions"]], "Melanocytes in eye": [[36, "Melanocytes-in-eye"]], "Sample and fetch 150k cells from eye tissue": [[36, "Sample-and-fetch-150k-cells-from-eye-tissue"]], "Observations": [[36, "Observations"], [36, "id1"], [36, "id2"]], "Retinal bipolar neurons in eye": [[36, "Retinal-bipolar-neurons-in-eye"]], "Dopaminergic neurons in brain": [[36, "Dopaminergic-neurons-in-brain"]], "Sample and fetch 150k cells from brain tissue": [[36, "Sample-and-fetch-150k-cells-from-brain-tissue"]], "Pulmonary ionocytes in lung (Tabula Sapiens)": [[36, "Pulmonary-ionocytes-in-lung-(Tabula-Sapiens)"]], "Fetch lung cells from Tabula Sapiens": [[36, "Fetch-lung-cells-from-Tabula-Sapiens"]], "Exploring all data from a tissue": [[37, "Exploring-all-data-from-a-tissue"]], "Learning about the lung data in the Census": [[37, "Learning-about-the-lung-data-in-the-Census"]], "Learning about cells of lung data": [[37, "Learning-about-cells-of-lung-data"]], "Datasets": [[37, "Datasets"]], "Disease": [[37, "Disease"]], "Sex": [[37, "Sex"]], "Cell vs nucleus": [[37, "Cell-vs-nucleus"]], "Cell types": [[37, "Cell-types"]], "Sub-tissues": [[37, "Sub-tissues"]], "Learning about genes of lung data": [[37, "Learning-about-genes-of-lung-data"]], "Summary of lung metadata": [[37, "Summary-of-lung-metadata"]], "Fetching all single-cell human lung data from the Census": [[37, "Fetching-all-single-cell-human-lung-data-from-the-Census"]], "Calculating QC metrics of the lung data": [[37, "Calculating-QC-metrics-of-the-lung-data"]], "Creating a normalized expression layer and embeddings": [[37, "Creating-a-normalized-expression-layer-and-embeddings"]], "Geneformer for cell class prediction and data projection": [[38, "Geneformer-for-cell-class-prediction-and-data-projection"]], "System requirements": [[38, "System-requirements"], [40, "System-requirements"]], "Downloading example data": [[38, "Downloading-example-data"], [40, "Downloading-example-data"]], "Downloading the fine-tuned Geneformer model": [[38, "Downloading-the-fine-tuned-Geneformer-model"]], "Importing required packages": [[38, "Importing-required-packages"]], "Preparing data and model": [[38, "Preparing-data-and-model"]], "Preparing single-cell data": [[38, "Preparing-single-cell-data"]], "Preparing data from model": [[38, "Preparing-data-from-model"]], "Using the Geneformer fine-tuned model for cell subclass inference": [[38, "Using-the-Geneformer-fine-tuned-model-for-cell-subclass-inference"]], "Loading tokenized data": [[38, "Loading-tokenized-data"]], "Performing inference of cell subclass": [[38, "Performing-inference-of-cell-subclass"]], "Inspecting inference results": [[38, "Inspecting-inference-results"]], "Using the Geneformer fine-tuned model for data projection": [[38, "Using-the-Geneformer-fine-tuned-model-for-data-projection"]], "Generating Geneformer embeddings for 10X PBMC 3K data": [[38, "Generating-Geneformer-embeddings-for-10X-PBMC-3K-data"]], "Joining Geneformer embeddings from 10X PBMC 3K data with other Census datasets": [[38, "Joining-Geneformer-embeddings-from-10X-PBMC-3K-data-with-other-Census-datasets"]], "Normalizing full-length gene sequencing data": [[39, "Normalizing-full-length-gene-sequencing-data"]], "Opening the census": [[39, "Opening-the-census"], [50, "Opening-the-census"]], "Fetching full-length example sequencing data (Smart-Seq)": [[39, "Fetching-full-length-example-sequencing-data-(Smart-Seq)"]], "Normalizing expression to account for gene length": [[39, "Normalizing-expression-to-account-for-gene-length"]], "Validation through clustering exploration": [[39, "Validation-through-clustering-exploration"]], "scVI for cell type prediction and data projection": [[40, "scVI-for-cell-type-prediction-and-data-projection"]], "Downloading the trained scVI model": [[40, "Downloading-the-trained-scVI-model"]], "Using the scVI pretrained model for data projection": [[40, "Using-the-scVI-pretrained-model-for-data-projection"]], "Using the scVI pretrained model for cell cell type inference.": [[40, "Using-the-scVI-pretrained-model-for-cell-cell-type-inference."]], "Summarizing cell and gene metadata": [[41, "Summarizing-cell-and-gene-metadata"]], "Summarizing cell metadata": [[41, "Summarizing-cell-metadata"]], "Example: Summarize all cell types": [[41, "Example:-Summarize-all-cell-types"]], "Example: Summarize a subset of cell types, selected with a value_filter": [[41, "Example:-Summarize-a-subset-of-cell-types,-selected-with-a-value_filter"]], "Full Census metadata stats": [[41, "Full-Census-metadata-stats"]], "Access CELLxGENE collaboration embeddings (scVI, Geneformer)": [[42, "Access-CELLxGENE-collaboration-embeddings-(scVI,-Geneformer)"]], "Storage format": [[42, "Storage-format"], [48, "Storage-format"]], "Query cells and load associated embeddings": [[42, "Query-cells-and-load-associated-embeddings"], [48, "Query-cells-and-load-associated-embeddings"]], "Loading embeddings into an AnnData obsm slot": [[42, "Loading-embeddings-into-an-AnnData-obsm-slot"]], "AnnData embeddings via cellxgene_census.get_anndata()": [[42, "AnnData-embeddings-via-cellxgene_census.get_anndata()"], [48, "AnnData-embeddings-via-cellxgene_census.get_anndata()"]], "AnnData embeddings via ExperimentAxisQuery": [[42, "AnnData-embeddings-via-ExperimentAxisQuery"], [48, "AnnData-embeddings-via-ExperimentAxisQuery"]], "Loading embeddings into a Scipy matrices and NumPy arrays": [[42, "Loading-embeddings-into-a-Scipy-matrices-and-NumPy-arrays"]], "Generating citations for Census slices": [[43, "Generating-citations-for-Census-slices"]], "Generating citation strings": [[43, "Generating-citation-strings"]], "Via cell metadata query": [[43, "Via-cell-metadata-query"]], "Via AnnData query": [[43, "Via-AnnData-query"]], "Computing on X using online (incremental) algorithms": [[44, "Computing-on-X-using-online-(incremental)-algorithms"]], "Incremental count and mean calculation.": [[44, "Incremental-count-and-mean-calculation."]], "Incremental variance calculation": [[44, "Incremental-variance-calculation"]], "Counting cells per gene, grouped by dataset_id": [[44, "Counting-cells-per-gene,-grouped-by-dataset_id"]], "Genes measured in each cell (dataset presence matrix)": [[45, "Genes-measured-in-each-cell-(dataset-presence-matrix)"]], "Fetching the IDs of the Census datasets": [[45, "Fetching-the-IDs-of-the-Census-datasets"]], "Fetching the dataset presence matrix": [[45, "Fetching-the-dataset-presence-matrix"]], "Identifying genes measured in a specific dataset.": [[45, "Identifying-genes-measured-in-a-specific-dataset."]], "Identifying datasets that measured specific genes": [[45, "Identifying-datasets-that-measured-specific-genes"]], "Identifying all genes measured in a dataset": [[45, "Identifying-all-genes-measured-in-a-dataset"]], "Exploring the Census Datasets table": [[46, "Exploring-the-Census-Datasets-table"]], "Fetching the datasets table": [[46, "Fetching-the-datasets-table"]], "Fetching the expression data from a single dataset": [[46, "Fetching-the-expression-data-from-a-single-dataset"]], "Downloading the original source H5AD file of a dataset.": [[46, "Downloading-the-original-source-H5AD-file-of-a-dataset."]], "Understanding and filtering out duplicate cells": [[47, "Understanding-and-filtering-out-duplicate-cells"]], "Why are there duplicate cells in the Census?": [[47, "Why-are-there-duplicate-cells-in-the-Census?"]], "An example: duplicate cells in the Tabula Muris Senis data": [[47, "An-example:-duplicate-cells-in-the-Tabula-Muris-Senis-data"]], "Filtering out duplicate cells": [[47, "Filtering-out-duplicate-cells"]], "Filtering out duplicate cells when reading the obs data frame.": [[47, "Filtering-out-duplicate-cells-when-reading-the-obs-data-frame."]], "Filtering out duplicate cells when creating an AnnData": [[47, "Filtering-out-duplicate-cells-when-creating-an-AnnData"]], "Filtering out duplicate cells for out-of-core operations.": [[47, "Filtering-out-duplicate-cells-for-out-of-core-operations."]], "Access CELLxGENE-hosted embeddings": [[48, "Access-CELLxGENE-hosted-embeddings"]], "Contents": [[48, "Contents"]], "Load an embedding into an AnnData obsm slot": [[48, "Load-an-embedding-into-an-AnnData-obsm-slot"]], "Load an embedding into a dense NumPy array": [[48, "Load-an-embedding-into-a-dense-NumPy-array"]], "Load embeddings and fetch associated Census data": [[48, "Load-embeddings-and-fetch-associated-Census-data"]], "Embedding Metadata": [[48, "Embedding-Metadata"]], "Querying data using the gget cellxgene module": [[49, "Querying-data-using-the-gget-cellxgene-module"]], "Install gget and set up cellxgene module": [[49, "Install-gget-and-set-up-cellxgene-module"]], "Fetch an AnnData object by selecting gene(s), tissue(s) and cell type(s)": [[49, "Fetch-an-AnnData-object-by-selecting-gene(s),-tissue(s)-and-cell-type(s)"]], "Plot a dot plot similar to those shown on the CZ CELLxGENE Discover Gene Expression": [[49, "Plot-a-dot-plot-similar-to-those-shown-on-the-CZ-CELLxGENE-Discover-Gene-Expression"]], "Fetch only cell metadata (corresponds to AnnData.obs)": [[49, "Fetch-only-cell-metadata-(corresponds-to-AnnData.obs)"]], "Use gget cellxgene from the command line": [[49, "Use-gget-cellxgene-from-the-command-line"]], "Querying and fetching the single-cell data and cell/gene metadata.": [[50, "Querying-and-fetching-the-single-cell-data-and-cell/gene-metadata."]], "Querying expression data": [[50, "Querying-expression-data"]], "Querying cell metadata (obs)": [[50, "Querying-cell-metadata-(obs)"]], "Querying gene metadata (var)": [[50, "Querying-gene-metadata-(var)"]], "Exploring pre-calculated summary cell counts": [[51, "Exploring-pre-calculated-summary-cell-counts"]], "Fetching the census_summary_cell_counts dataframe": [[51, "Fetching-the-census_summary_cell_counts-dataframe"]], "Creating summary counts beyond pre-calculated values.": [[51, "Creating-summary-counts-beyond-pre-calculated-values."]], "Experimental Highly Variable Genes API": [[52, "Experimental-Highly-Variable-Genes-API"]], "get_highly_variable_genes": [[52, "get_highly_variable_genes"]], "highly_variable_genes": [[52, "highly_variable_genes"]], "Out-of-core (incremental) mean and variance calculation": [[53, "Out-of-core-(incremental)-mean-and-variance-calculation"]], "The mean and variance API": [[53, "The-mean-and-variance-API"]], "Example: calculate mean and variance for a slice of the Census": [[53, "Example:-calculate-mean-and-variance-for-a-slice-of-the-Census"]], "Training a PyTorch Model": [[54, "Training-a-PyTorch-Model"]], "Open the Census": [[54, "Open-the-Census"]], "Create an ExperimentDataPipe": [[54, "Create-an-ExperimentDataPipe"]], "ExperimentDataPipe class explained": [[54, "ExperimentDataPipe-class-explained"]], "ExperimentDataPipe parameters explained": [[54, "ExperimentDataPipe-parameters-explained"]], "Split the dataset": [[54, "Split-the-dataset"]], "Create the DataLoader": [[54, "Create-the-DataLoader"]], "Define the model": [[54, "Define-the-model"]], "Train the model": [[54, "Train-the-model"]], "Make predictions with the model": [[54, "Make-predictions-with-the-model"]], "Python API": [[55, "module-cellxgene_census"]], "Open/retrieve Cell Census data": [[55, "open-retrieve-cell-census-data"]], "Get slice as AnnData": [[55, "get-slice-as-anndata"]], "Feature presence matrix": [[55, "feature-presence-matrix"]], "Versioning of Cell Census builds": [[55, "versioning-of-cell-census-builds"]], "Experimental: Machine Learning": [[55, "experimental-machine-learning"]], "Experimental: Processing": [[55, "experimental-processing"]], "Experimental: Utility": [[55, "experimental-utility"]], "Dependencies": [[56, "dependencies"]], "Set up Python environment": [[56, "set-up-python-environment"]], "Verify your installation": [[56, "verify-your-installation"]], "Latest development version": [[56, "latest-development-version"]], "What is SOMA": [[57, "what-is-soma"]]}, "indexentries": {"download_source_h5ad() (in module cellxgene_census)": [[1, "cellxgene_census.download_source_h5ad"]], "experimentdatapipe (class in cellxgene_census.experimental.ml.pytorch)": [[2, "cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe"]], "__init__() (cellxgene_census.experimental.ml.pytorch.experimentdatapipe method)": [[2, "cellxgene_census.experimental.ml.pytorch.ExperimentDataPipe.__init__"]], "stats (class in cellxgene_census.experimental.ml.pytorch)": [[3, "cellxgene_census.experimental.ml.pytorch.Stats"]], "__init__() (cellxgene_census.experimental.ml.pytorch.stats method)": [[3, "cellxgene_census.experimental.ml.pytorch.Stats.__init__"]], "experiment_dataloader() (in module cellxgene_census.experimental.ml.pytorch)": [[4, "cellxgene_census.experimental.ml.pytorch.experiment_dataloader"]], "get_highly_variable_genes() (in module cellxgene_census.experimental.pp)": [[5, "cellxgene_census.experimental.pp.get_highly_variable_genes"]], "highly_variable_genes() (in module cellxgene_census.experimental.pp)": [[6, "cellxgene_census.experimental.pp.highly_variable_genes"]], "mean_variance() (in module cellxgene_census.experimental.pp)": [[7, "cellxgene_census.experimental.pp.mean_variance"]], "x_sparse_iter() (in module cellxgene_census.experimental.util)": [[8, "cellxgene_census.experimental.util.X_sparse_iter"]], "get_anndata() (in module cellxgene_census)": [[9, "cellxgene_census.get_anndata"]], "get_census_version_description() (in module cellxgene_census)": [[10, "cellxgene_census.get_census_version_description"]], "get_census_version_directory() (in module cellxgene_census)": [[11, "cellxgene_census.get_census_version_directory"]], "get_default_soma_context() (in module cellxgene_census)": [[12, "cellxgene_census.get_default_soma_context"]], "get_presence_matrix() (in module cellxgene_census)": [[13, "cellxgene_census.get_presence_matrix"]], "get_source_h5ad_uri() (in module cellxgene_census)": [[14, "cellxgene_census.get_source_h5ad_uri"]], "open_soma() (in module cellxgene_census)": [[15, "cellxgene_census.open_soma"]], "cellxgene_census": [[55, "module-cellxgene_census"]], "module": [[55, "module-cellxgene_census"]]}})
\ No newline at end of file