共用方式為


GSA Site Scanning(獨立出版商)

探索對美國聯邦網站的健康狀況和合規性的全面見解,為了解聯邦網站的動態和標準提供一個窗口。 透過自動掃描,該服務產生有關網站政策合規性和最佳實踐的詳細數據,增強政府數位資產的可訪問性和管理。

此連接器適用於以下產品和區域:

服務 Class Regions
副駕駛工作室 進階 除下列區域外的所有 Power Automate 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
邏輯應用程式 標準 所有 Logic Apps 區域, 但下列區域除外:
     - Azure Government 區域
     - Azure 中國區域
     - 美國國防部 (DoD)
Power Apps 進階 除下列區域外的所有 Power Apps 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
Power Automate(自動化服務) 進階 除下列區域外的所有 Power Automate 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
連絡人​​
名稱 理查德·威爾遜
URL https://www.richardawilson.com/
Email richard.a.wilson@microsoft.com
連接器中繼資料
Publisher 理查德·威爾遜
網站 https://open.gsa.gov/api/site-scanning-api
隱私策略 https://www.gsa.gov/technology/government-it-initiatives/digital-strategy/terms-of-service-for-developer-resources
類別 資訊科技營運

正在建立連線

連接器支援下列驗證類型:

預設值 建立連線的參數。 所有區域 不可共享

預設

適用:所有地區

建立連線的參數。

這不是可共用的連線。 如果 Power App 與其他使用者共用,系統會明確提示其他使用者建立新連線。

名稱 類型 Description 為必填項目
GSA API 金鑰 securestring GSA API 金鑰可從 https://open.gsa.gov/api/site-scanning-api/

節流限制

名稱 呼叫 續約期間
每個連線的 API 呼叫 100 60 秒

動作

執行網站分析

根據目標 URL、最終 URL 和掃描狀態等各種參數對網站進行全面分析。

檢索網站資訊

擷取網站的詳細資訊,包括目標和最終 URL、擁有權、掃描狀態和分析偵測。

透過 URL 檢索網站資訊

根據指定的 URL 擷取網站的詳細資訊。

執行網站分析

根據目標 URL、最終 URL 和掃描狀態等各種參數對網站進行全面分析。

參數

名稱 機碼 必要 類型 Description
目標 URL 網域
target_url_domain string

網域名稱加上目標 URL 網域的頂層網域 (TLD)。 此參數指定掃描器的起點,與重定向後掃描結束的最終 URL 網域形成鮮明對比。

最終到達網址網域
final_url_domain string

網域名稱加上最終到達網址網域的頂層網域 (TLD)。 最終 URL 網域是掃描器在遵循重新導向後結束的位置,與目標 URL 網域相反。

最終到達網址即時
final_url_live boolean

透過傳回 2xx 系列中的 HTTP 狀態碼,指出最終到達網址是否有效。

目標 URL 重新導向
target_url_redirects boolean

布林值,指出 Target URL 是否重新導向,當傳回 3xx HTTP 狀態碼時會發生這種情況。 請注意,掃描器已停用快取,因此不存在 304 HTTP 狀態碼。

目標網址代理商擁有者
target_url_agency_owner string

指定擁有或營運與目標URL相關聯網站的機構。

目標網址局擁有者
target_url_bureau_owner string

指定擁有或營運與目標URL相關聯的網站的機構。

掃描狀態
primary_scan_status string

擷取網站掃描的狀態,以及任何已知的失敗原因。 值 unknown_error 是為系統中尚未編碼的錯誤保留的。

在最終到達URL處檢測到DAP
dap_detected_final_url boolean

布林值,指出是否在「最終 URL」偵測到數位分析程式 (DAP)。

傳回

身體
AnalysisDto

檢索網站資訊

擷取網站的詳細資訊,包括目標和最終 URL、擁有權、掃描狀態和分析偵測。

參數

名稱 機碼 必要 類型 Description
目標 URL 網域
target_url_domain string

網域名稱加上目標 URL 網域的頂層網域 (TLD)。 目標 URL 是掃描器的開始位置,與最終 URL 形成鮮明對比,最終 URL 掃描器在重新導向後結束。

最終到達網址網域
final_url_domain string

網域名稱加上最終到達網址網域的頂層網域 (TLD)。 最終 URL 是掃描器在遵循重新導向後結束的位置,與目標 URL 相反。

最終到達網址即時
final_url_live boolean

指出最終到達網址是否為即時,並傳回 2xx 系列中的 HTTP 狀態碼。

目標 URL 重新導向
target_url_redirects boolean

如果 Target URL 重新導向,則會記錄 (如果傳回 3xx HTTP 狀態碼,則為 true)。 掃描器已停用快取,因此不存在 304 狀態碼。

目標網址代理商擁有者
target_url_agency_owner string

擁有或營運與目標URL相關聯的網站的代理商。

目標網址局擁有者
target_url_bureau_owner string

擁有或營運與目標 URL 相關聯的網站的機構。

掃描狀態
primary_scan_status string

擷取掃描狀態和任何已知的失敗原因。 unknown_error保留給未編碼的錯誤。

在最終到達URL處檢測到DAP
dap_detected_final_url boolean

指出是否在最終 URL 偵測到數位分析程式 (DAP)。

限制
limit integer

指定要在單一結果頁面中傳回的項目數目。

頁面
page integer

指定要擷取的結果頁碼。

傳回

透過 URL 檢索網站資訊

根據指定的 URL 擷取網站的詳細資訊。

參數

名稱 機碼 必要 類型 Description
網站 URL
url True string

要擷取資訊的網站 URL。 這應該包括網域名稱和任何相關的路徑元件。

傳回

定義

AnalysisDto

名稱 路徑 類型 Description
分析項目總數
total number

分析的項目總數。

分析的機構總數
totalAgencies number

分析網站的機構總數。

最終到達網址基底網域總數
totalFinalUrlBaseDomains number

分析的唯一最終 URL 基底網域總數。

PaginatedWebsiteResponseDto

名稱 路徑 類型 Description
網站項目
items array of WebsiteApiResultDto

網站結果陣列。

首頁鏈接
links.first string

結果第一頁的連結。

最後一頁鏈接
links.last string

結果最後一頁的連結。

下一頁鏈接
links.next string

結果下一頁的連結。 在結果的最後一頁,這將是一個空字串。

上一頁連結
links.previous string

結果上一頁的連結。 在結果的第一頁上,這將是一個空字串。

當前頁面
meta.currentPage number

目前的頁碼。

項目數量
meta.itemCount number

PaginationResponseDto.items 陣列中的專案數目。

每頁項目數
meta.itemsPerPage number

每頁的項目數。 這應該與限制查詢參數相同。

項目總數
meta.totalItems number

符合查詢的項目總數。

總頁數
meta.totalPages number

總頁數,以 floor(totalItems / itemsPerPage) 計算。

WebsiteApiResultD設為

名稱 路徑 類型 Description
規範鏈接
canonical_link string

指出存在標準連結標籤。

Cloud.gov Pages 託管
cloud_dot_gov_pages boolean

表示最終到達網址是使用 Cloud.gov 頁面代管。

內容管理系統 (CMS)
cms string

指出用來代管最終 URL 的內容管理系統。

在最終到達URL處檢測到DAP
dap_detected_final_url boolean

布林值,代表最終 URL 上存在 Digital Analytics 程式。

最終到達URL的DAP引數
dap_parameters_final_url object

在最終 URL 上具有 Digital Analytics 程式參數索引鍵和值的物件。

DNS 主機名稱
dns_hostname string

底層系統的網域,通常建議使用雲端或 CDN 提供者。

最終到達網址
final_url string

從目標 URL 重新導向之後的 URL。

最終到達網址 MIME 類型
final_url_MIMEType string

從 Content-Type 標頭擷取的最終 URL 的 MIME 型別。

最終到達網址網域
final_url_domain string

最終到達網址的網域名稱 + 頂層網域。

最終到達網址即時
final_url_live boolean

布林值,代表最終 URL 是否傳回 2xx 系列 HTTP 狀態碼。

最終到達網址:相同網域
final_url_same_domain boolean

布林值欄位,表示最終 URL 是否與目標 URL 位於同一網域中。 如果為 false,則表示重新導向。

最終到達網址:相同網站
final_url_same_website boolean

指出最終到達網址的路徑或網域是否與目標網址不同。

最終到達網址狀態碼
final_url_status_code number

最終 URL 的 HTTP 狀態碼。

最終到達網址網站
final_url_website string

包括最終到達網址的子網域和頂層網域。

最終到達網址的主要元素存在
main_element_present_final_url boolean

指出最終到達網址中是否 <存在主要> 元素。

最終 URL 的 Open Graph 文章修改日期
og_article_modified_final_url string

Open Graph 文章已修改標籤 (如果最終 URL 上可用)。

最終到達網址的開啟圖表文章發佈日期
og_article_published_final_url string

Open Graph 文章已發佈標籤 (如果最終到達網址上有的話)。

在最終到達網址開啟圖表說明
og_description_final_url string

Open Graph 描述標籤(如果在最終 URL 上找到)。

在最終到達網址開啟圖表標題
og_title_final_url string

Open Graph 標題標籤 (如果在最終 URL 上找到)。

Robots.txt 爬蟲延遲
robots_txt_crawl_delay integer

編目延遲值(以秒為單位)(如果存在於 robots.txt 檔案中)。

偵測到 Robots.txt
robots_txt_detected boolean

指出是否偵測到 robots.txt 檔案。

Robots.txt 最終到達網址
robots_txt_final_url string

任何重新導向後 robots.txt 檔案的最終 URL。

Robots.txt 最終到達網址 MIME 類型
robots_txt_final_url_MIMETYPE string

從 Content-Type 標頭擷取的 robots.txt 頁面的 MIME 型別。

Robots.txt 最終到達網址即時
robots_txt_final_url_live boolean

指出最終到達網址 HTTP 狀態 robots.txt 是否屬於 2xx 系列。

Robots.txt 最終 URL 大小 (以位元組為單位)
robots_txt_final_url_size_in_bytes number

robots.txt 檔案的檔案大小 (以位元組為單位)。

Robots.txt 最終到達網址狀態碼
robots_txt_final_url_status_code number

robots.txt 最終到達網址的 HTTP 狀態碼。

Robots.txt 目標 URL 重新導向
robots_txt_target_url_redirects boolean

指出目標 robots.txt URL 是否重新導向。 這會特別針對 robots.txt 檔案。

掃描日期
scan_date string

執行掃描的日期時間。

掃描狀態
primary_scan_status string

核心掃描的成功狀態。

Sitemap.xml URL 計數
sitemap_xml_count integer

指出在 sitemap.xml 檔案中找到的 url> 元素數目<。

偵測到 Sitemap.xml
sitemap_xml_detected boolean

指出是否找到 sitemap.xml 檔案。

Sitemap.xml 最終到達網址
sitemap_xml_final_url string

任何重新導向後 sitemap.xml 頁面的最終 URL。

Sitemap.xml 最終到達網址 MIME 類型
sitemap_xml_final_url_MIMETYPE string

從 Content-Type 標頭擷取的 sitemap.xml 最終 URL 的 MIME 型別。

Sitemap.xml 最終到達網址檔案大小
sitemap_xml_final_url_filesize integer

sitemap.xml 頁面的檔案大小 (以位元組為單位)。

Sitemap.xml 最終到達網址即時
sitemap_xml_final_url_live boolean

指出最終 sitemap.xml 網址狀態碼是否屬於 2xx 系列。

Sitemap.xml 最終到達網址狀態碼
sitemap_xml_final_url_status_code number

sitemap.xml 頁面的 HTTP 狀態碼。

Sitemap.xml PDF URL 計數
sitemap_xml_pdf_count integer

sitemap.xml中具有PDF副檔名的URL數目。

Sitemap.xml 目標 URL 重新導向
sitemap_xml_target_url_redirects boolean

指出 sitemap.xml 頁面是否重新導向。 這會特別針對 sitemap.xml 檔案。

資料來源:DAP List
source_list_dap boolean

指出 Digital Analytics 程式是否為「目標 URL 清單」提供此 URL。

來源於聯邦網域列表
source_list_federal_domains boolean

指出「聯邦網域清單」是否為「目標 URL 清單」提供此 URL。

來源於其他列表
source_list_other boolean

指出手動維護的其他網站清單是否為目標URL清單提供此URL。

來源於 Pulse CIO 名單
source_list_pulse boolean

指出 pulse.cio.gov 快照是否為目標 URL 清單提供此 URL。

目標網址
target_url string

掃描器開始掃描時使用的 URL。

目標URL 404測試
target_url_404_test boolean

測試目標 URL 是否透過呼叫 UUID 型路徑名稱來正確處理 404。

目標網址代理商擁有者
target_url_agency_owner string

擁有目標網址的代理商。

目標網址:政府分支機構
target_url_branch string

與 URL 相關聯的政府部門。

目標網址局擁有者
target_url_bureau_owner string

擁有目標 URL 的局。

目標 URL 網域
target_url_domain string

目標URL的基底網域(網域名稱+頂層網域)。

目標 URL 重新導向
target_url_redirects boolean

指出目標 URL 是否重新導向。

第三方服務計數
third_party_service_count number

找到的第三方服務數目。

第三方服務網域
third_party_service_domains array of string

從最終 URL 進行輸出呼叫的第三方服務清單。 第三方定義為與 URL 的主機名不匹配。

USWDS 計數
uswds_count number

所有 USWDS 似然啟發式方法的總和。

USWDS 網站圖標
uswds_favicon number

HTML 源中存在 USWDS 美國國旗網站圖標。 存在為 USWDS 似然啟發式增加了 20 分。

CSS 中的 USWDS 網站圖示
uswds_favicon_in_css number

CSS 來源中存在 USWDS 美國國旗網站圖示。 存在為 USWDS 似然啟發式增加了 20 分。

USWDS 內嵌 CSS
uswds_inline_css number

內嵌 HTML 源中 .usa- CSS 類的出現次數。

USWDS 公共無字體
uswds_publicsans_font number

CSS 源中存在 Public Sans 字體。 存在為 USWDS 似然啟發式增加了 20 分。

USWDS 語意版本
uswds_semantic_version string

USWDS 的語意版本字串。

USWDS 源無字體
uswds_source_sans_font number

CSS 源代碼中存在 Source Sans 字體。 存在為 USWDS 可能性啟發式增加了 5 分。

USWDS 字串出現次數
uswds_string number

字串 uswds 在 HTML 來源中出現的次數。

CSS 中的 USWDS 字串
uswds_string_in_css number

CSS 來源中 uswds 的出現次數。

USWDS 表格
uswds_tables number

計算 (HTML 的數量

元素) * -10。
元素是 USWDS 存在的負面啟發式指標。

USWDS 美國課程
uswds_usa_classes number

找到以 .usa- 開頭的 CSS 類別數量。

USWDS 版本
uswds_version number

CSS 源中存在 USWDS 版本。 存在為 USWDS 似然啟發式增加了 20 分。