架构和运行机制

2024-10-22 11:26 由 wang_yb 发表于 #后端开发

本篇主要介绍Streamlit的核心架构和运行机制，

目的是希望朋友们能先从整体上宏观的了解Streamlit，利用它提供的机制开发性能更高效的应用。

1. 架构

Streamlit比较特殊，它对使用者来说是BS架构应用，而随开发者来说其实更像一个CS架构的应用。

为什么说Streamlit更像CS架构呢？

因为后端功能和前端UI部分都是用Python写，所以开发Streamlit应用时的感觉，就像开发桌面应用一样。

如果你有CS应用的开发经验，比如QT，.Net平台的winform或WPF等，那么开发Streamlit的应用会觉得非常亲切。

虽然最终是在浏览器中使用Streamlit应用，但是开发时完全不需要HTML、CSS或JavaScript等前端知识。

不过，Streamlit App部署之后，需要注意它BS应用的一面：

Streamlit App发布之后是多用户使用的，根据预估的用户量考虑服务器的配置资源
用户端通过浏览器来使用Streamlit App，所以无法访问服务器的文件、目录或操作系统。
如果需要与任何外围设备（如摄像头）通信，则必须使用Streamlit命令或自定义组件，这些命令或组件将通过用户的浏览器访问这些设备

2. 运行流程

Streamlit的主要流程简单直接：

服务端通过streamlit run命令启动
初始化App页面
客户端打开浏览器访问
用户在浏览器中操作
服务端根据用户操作进行数据处理
处理之后更新页面
新的页面返回到浏览器

Streamlit App每次接收用户操作之后，会重新运行整个代码，然后将重新渲染的页面返回，

这样会带来两个显而易见的问题。

如果代码中加载了大量的数据，每次用户操作后都会重新加载数据，影响性能

比如：

import streamlit as st
import pandas as pd
from datetime import datetime

## 数据加载
def load_data():
    df = pd.DataFrame()
    df.index = pd.date_range("2024/10/01", periods=20)
    df["A"] = range(20)
    df["B"] = range(20)

    st.text(f"加载数据时间：{datetime.now().strftime("%Y-%m-%d %H:%M:%S")}")
    return df

# 加载数据
data = load_data()

date_range = st.slider(
    "日期范围",
    min_value=datetime(2024, 10, 1),
    max_value=datetime(2024, 10, 20),
    value=(datetime(2024, 10, 1), datetime(2024, 10, 20)),
)
data = data[data.index >= date_range[0]]
data = data[data.index <= date_range[1]]
st.table(data)

每次加载数据时，会显示数据加载的时间：st.text(f"加载数据时间：{datetime.now().strftime("%Y-%m-%d %H:%M:%S")}")

每次移动日期范围时，都会重新加载整个数据。

多个用户操作直接如果有联系，操作之间的状态无法保持

比如：

count = 0
st.text(f"Click {count}")

if st.button("ADD"): # 点击按钮时执行
    count += 1

点击上面的按钮ADD，文本显示的始终是：Click 0。

因为，点击按钮时，执行count += 1之后，还会将整个代码重新执行，count=0 也被重新执行。

下一节介绍如何解决这两个问题。

3. 缓存和状态

解决Streamlit App的数据和状态无法保存的问题，就要用到缓存（cache）和状态（session）两个重要的功能。

首先，用缓存来改进上一节中的数据加载问题。

## 数据加载
@st.cache_data
def load_data():
    #... 省略 ...

修改方法非常简单，只要在原来代码中的load_data函数上面加一个装饰器@st.cache_data就足够了。

改进之后，移动日期范围时，加载数据时间一直没变，说明没有反复的加载数据。

接下来，用状态（session）来修复上一节中计数无法增加的问题。

if "count" not in st.session_state:
    st.session_state.count = 0

st.text(f"Click {st.session_state.count}")

if st.button("ADD"):
    st.session_state.count += 1

把计数用的count放入st.session_state中。

st.session_state用于在用户的每次会话中共享变量，确保这些变量在重新运行时仍然可用。

4. 总结

本篇讨论了Streamlit的架构和运行机制，整体来看它的设计简单直接，很好理解。

随后介绍了Streamlit中的缓存cache和状态session，它们在数据处理、存储和持久性方面有着重要作用。

使用时，注意区分缓存cache和状态session的使用场景。

缓存cache主要用于提高应用性能，通过存储和重用之前计算过的结果来避免重复计算。它关注的是数据的处理效率和资源消耗；

而状态session主要用于在用户的会话中共享变量和状态信息。它关注的是用户数据的持久性和在不同事件回调之间的数据一致性。

用 (Excel) VBA 读取 OneNote！

本文记录，用 VBA 读取 OneNote 的方法，这块似乎一直是空白，研究了好久才找到解决方案！小白贡献，语失莫怪！问题背景：我在 OneNote 里有上百篇笔记，可 OneNote 自己，却无法导出全部的标题。于是我千方百计，想要读取 OneNote 的文件，来获取标题和日志信息。尝试了各种 ...阅读全文

高可用之限流 09-guava RateLimiter 入门使用简介 & 源码分析

限流系列开源组件 rate-limit: 限流高可用之限流-01-入门介绍高可用之限流-02-如何设计限流框架高可用之限流-03-Semaphore 信号量做限流高可用之限流-04-fixed window 固定窗口高可用之限流-05-slide window 滑动窗口高可用之限流-0 ...阅读全文

Tomcat线程池详解，为什么SpringBoot最大支持200并发？

Q：经典面试题，SpringBoot 应用可以同时并发处理多少请求？ A：SpringBoot 应用并发处理请求数主要由两个因素影响，使用的 Servlet容器（默认使用 Tomcat，常用的还有 jetty、undertow）和配置项。所以在默认配置下，SprigBoot 应用可以并发处理 2 ...阅读全文

循环结构程序设计

为什么需要循环控制循环结构或称重复结构几乎每一种计算机高级语言都提供了循环控制，用来处理需要进行的重复操作大多数的应用程序都会包含循环结构循环结构和顺序结构、选择结构是结构化程序设计的3中基本结构，它们是各种复杂程序的基本构成单元。用 while 语句实现循环 while 语句的一般形式： ...阅读全文

2000+多种开源大模型随意部署！一键搭建本地大模型，不挑环境、不挑配置（ollama 安装部署教程《Windows/Linux，Mac》）

2000+多种开源大模型随意部署！一键搭建本地大模型，不挑环境、不挑配置（ollama 安装部署教程《Windows/Linux，Mac》）一、Ollama介绍 2.1 基本介绍 Ollama是一个支持在Windows、Linux和MacOS上本地运行大语言模型的工具。它允许用户非常方便地运行和使 ...阅读全文

Java消息队列入门详解

在Java消息队列的实际应用场景中，RocketMQ作为一种高效可靠的消息队列服务，能够很好地满足不同业务需求。以下通过具体场景示例来讲解解耦、异步处理、削峰填谷、可靠性和扩展性这几个关键词。 ...阅读全文

PageHelper 分页插件使用中的那些“坑”

PageHelper 分页插件使用中的那些“坑” 引言在项目开发过程中，分页查询是常见的需求之一。PageHelper 是一个 MyBatis 的分页插件，它能够自动完成 MyBatis 的分页功能。然而，在使用过程中可能会遇到一些问题，特别是当手动在 SQL 中使用了 LIMIT 进行分页的情况 ...阅读全文

Python 在Excel中插入、替换、提取、或删除图片

Excel是主要用于处理表格和数据的工具，我们也能在其中插入、编辑或管理图片，为工作表增添视觉效果，提升报告的吸引力。本文将详细介绍如何使用Python操作Excel中的图片，包含以下4个基础示例： Python 在Excel中插入图片 Python 替换Excel中的图片 Python 提取Exc ...阅读全文

JAVA基础之十-不常用但是又希望能看懂的关键字/保留字

对于绝大部分JAVA工程师而言，大部分的关键字也是能够看懂的，但还是相当一部分比较不常见的关键字,妨碍了代码阅读。本文力图收集一些个人认为在CRUD机械工作中可能比较少见的一些关键字/保留字。此类关键字主要用于修饰方法和类。收集过程会持续一段时间，现在暂时没有时间也没有必要找出个人为人需要整理 ...阅读全文

Java 当中使用 “google.zxing ”开源项目和 “github 的 qrcode-plugin” 开源项目生成二维码

Java 当中使用 “google.zxing ”开源项目和 “github 的 qrcode-plugin” 开源项目生成二维码 @目录Java 当中使用 “google.zxing ”开源项目和 “github 的 qrcode-plugin” 开源项目生成二维码1. Java当中使用 ...阅读全文